kifish


博客页面

Crf

见: https://docs.google.com/document/d/e/2PACX-1vTe2sfb4Zmu-lwrtu1NKEiOUyCSonyk8ATR40IY-ZiiJB1yz4GY_DckhpuRwJbs1LeBvlaWXGFj9a50/pub

Hmm

英文材料: https://web.stanford.edu/~jurafsky/slp3/9.pdf 相关的中文资料(建议直接看英文资料) https://blog.csdn.net/likelet/article/details/7056068

Xgbt

可以看这份材料 -http://www.cnblogs.com/pinard/p/6140514.html gbdt回归: 原始的gbdt其实思想很简单,不是通过样本的bagging,而是通过多轮迭代。 每次的目标是拟合残差或者说是让输出增量逼近上一轮的残差(error),从而加上这个增量后...

Softmax

[1]这份材料相当深入浅出。 李航的书里把第K类另外处理了,其实是没有必要的,因为第K类和其他类的地位是一样的。[1]中的公式更好理解。 [1]中讲到softmax具有overparameterized,有多解,换句话说两组不同参数的softmax,给出的分布也有可能完全一样。 有点类似线...

语言模型

Collectively, the different units into which you can break down text (words, charac- ters, or n-grams) are called tokens, and breaking text into su...

Word2vec Gensim

-https://radimrehurek.com/gensim/models/word2vec.html 学习:https://rare-technologies.com/word2vec-tutorial/ (来自gensim文档的官方推荐) 建议直接看原文。 gensim比用nump...

Ui和逻辑分离 多线程

学习: -https://nikolak.com/pyqt-threading-tutorial/ 如果GUI app只有一个主线程,那么执行某个耗时较长的任务,会让user有卡顿的感觉,结果没法实时返回,并且也没办法终止执行这个任务。我们可以new一个线程去处理较为耗时的任务,再把处理结...

获得调用函数的标准输出

获得所调用的函数的标准输出,比如print()等。见SO: https://stackoverflow.com/questions/16571150/how-to-capture-stdout-output-from-a-python-function-call a.by import i...