瀚海星空

星空浩瀚 人类渺小

Kafka 使用实例

kafka介绍 本节部分摘自 Kafka 设计与原理详解。 apache kafka 由linkedin高吞吐量的分布式消息系统。基于push-subscribe的消息系统,它具备快速、可扩展、可持久化的特点。它现在是Apache旗下的一个开源系统,作为Hadoop生态系统的一部分,被各种商业公司广泛应用。它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于hadoop的...

docker使用

启动docker [zhouhh@mainServer ~]$ sudo systemctl start docker [zhouhh@mainServer ~]$ sudo systemctl enable docker [zhouhh@mainServer ~]$ docker pull hub.c.163.com/public/centos:7.2-tools 网络配置 d...

Spark安装使用实例

安装java opensdk 1.8 如果没有安装Java环境,需要先下载安装。 [zhouhh@mainServer ~]$ yum search java | grep openjdk [zhouhh@mainServer ~]$ sudo yum install java-1.8.0-openjdk-devel.x86_64 [zhouhh@mainServer ~]$ sudo y...

Centos7上安装docker-ce社区版

概述 本文是centos7上安装docker-ce社区版的最新稳定版的实录. docker-ce最新稳定版需要linux kernel 大于3.10. 可以用如下的程序来检查兼容性. curl https://raw.githubusercontent.com/docker/docker/master/contrib/check-config.sh > check-config....

感知器的两种实现

感知器的两种实现方式 1. 每一行样本循环进行处理(Stochastic Gradient Descent, SGD) 随机梯度下降,对每一行样本, 计算其参数w, 一次迭代全部样本.并在处理每个样本时逐步调整参数w. 这种方式最自然, 但参数会有反复.效率最低. # perceptron 感知器 # 周海汉 2017.5.21 import numpy as np # 感知器 c...

mnist 数据描述

概述 mnist 是纽约大学lecun教授基于nist数据集准备的一个60000张手写数字, 经常用于机器学习等练习用数据. MNIST数据集由手写的数字的图像组成,它分为了60,000训练数据和10,000个测试数据。有人加工过的nist.pkl.gz里面,官方的训练数据又进一步的分成50,000的训练数据和10,000的验证数据,以便于模型参数的选择。所有的图像都做了规范化的处理,每个...

机械匹配词表最大化分词

分词代码 # -*- coding:utf-8 -*- #简单的支持中文的正向最大匹配的机械分词 import string __dict = {} def load_dict(dict_file='words.dic'): #加载词库,把词库加载成一个key为首字符,value为相关词的列表的字典 words = [line.split(...

ipython gui错误

问题描述 两台mac book pro,一台安装完后执行ipython没有任何错误. 一台却报如下错误:UnknownBackend zhouhh@/Users/zhouhh $ ipython Python 3.6.0 |Anaconda custom (x86_64)| (default, Dec 23 2016, 13:19:00) Type "copyright", "credit...

在mac osx上安装机器学习开发环境

概述 上一篇“在linux上安装机器学习开发环境”文章演示了在centos下设置机器学习环境. 本篇讨论如何在mac下配置相关环境. 下载Anaconda Anaconda介绍在上篇中有, 在此不再重复. Anaconda 安装包可以到 https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 下载。 我下载的是4.3.1 zhh@z...

在linux上安装机器学习开发环境

下载Anoconda Anaconda 是一个用于科学计算的 Python 发行版,支持 Linux, Mac, Windows, 包含了众多流行的科学计算、数据分析的 Python 包。 Anaconda 具有比pip包管理更强大的能力,不仅管理python 包的依赖,也同时管理其他非python的依赖,所以有逐渐取代pip的趋势. 同时, Anaconda还有virtual envi...