说明:《Hadoop实战》英文版
说明:Deep Dive-How Spark Uses Memory
说明:《HDFS-Hadoop分布式文件系统深度实践》
说明:PRML读书会第八章 Graphical Models(贝叶斯网络和马尔科夫随机场的概念、联合概率分解、条件独立表示;图的概率推断inference)
说明:PRML读书会第九章 Mixture Models and EM(Kmeans;混合高斯模型以及EM(Expectation Maximization)算法;一
说明:PRML读书会第十章 Variational Inference(近似推断、变分推断用到的KL散度、根据平均场 Mean Field 思想的分解及迭代求最优解)
说明:PRML读书会第十一章 Sampling Methods(MCMC Markov Chain Monte Carlo,细致平稳条件;Metropolis-Has
说明:PRML读书会第十二章 Continuous Latent Variables(PCA Principal Component Analysis;PPCA;核P
说明:PRML读书会第十三章 Sequential Data(Hidden Markov Models及其EM求解、HMM的预测和解码)
说明:PRML读书会第十四章 Combining Models(committees;Boosting、AdaBoost;决策树和条件混合模型)
说明:PRML读书会第三章 Linear Models for Regression(线性基函数模型、正则化方法、贝叶斯线性回归等)
说明:PRML读书会第四章 Linear Models for Classification(贝叶斯marginalization、Fisher线性判别、感知机、概率
说明:PRML读书会第五章 Neural Networks(神经网络、BP误差后向传播链式求导法则、正则化、卷积网络)
说明:PRML读书会第六章 Kernel Methods(核函数,线性回归的Dual Representations;高斯过程 Gaussian Processes的
说明:PRML读书会第七章 Sparse Kernel Machines(支持向量机 support vector machine ;KKT条件;RVM)
大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。