Mining of Massive Datasets,大数据挖掘

Posted by abloz on February 22, 2013

由Anand Rajaraman (@anand_raj) 和 Jeff Ullman写的《Mining of Massive Datasets》,由Cambridge University Press出版。中文版由图灵文化翻译出版《大数据:互联网大规模数据挖掘与分布式处理》。内容看上去很不错。内容源自作者在斯坦福大学教授多年的“Web挖掘”的材料。两位作者也很有爱心,提供了英文版的下载,但因为于出版社版权协议,不能用于重新发布。

书籍和资料地址:http://infolab.stanford.edu/~ullman/mmds.html

Download the Latest Book (415 pages, approximately 2.5MB)

Chapter 1 Data Mining Chapter 2 Map-Reduce and the New Software Stack Chapter 3 Finding Similar Items Chapter 4 Mining Data Streams Chapter 5 Link Analysis Chapter 6 Frequent Itemsets Chapter 7 Clustering Chapter 8 Advertising on the Web Chapter 9 Recommendation Systems Chapter 10 Mining Social-Network Graphs