下面是美国coursera公司工程师董飞在知乎的总结。
美国大数据创业公司篇
董飞 ·
这里面创业公司太多了,包含提供商务数据分析,可视化报表,大数据平台,数据存储,挖掘应用等,我就简单说一些我感兴趣的,它们大多在硅谷,其他的可以参考。更新是到2015年6月2日,88家。
Palantir__:融资:9.5亿美元。150亿美金估值,已经是超级独角兽单独列出来。Peter Thiel创办大数据公司。数据集成、 信息管理和定量的分析。连接到商业、 专有和公共数据集,并发现趋势、 关系和异常,包括预测分析。
##############
Database
MemSQL__: 号称最快的内存数据库。
GraphSQL__:高效、大容量的图形数据库和分析平台,创始人是国人。
MongoDB__: 融资:3.11亿美元。细分行业:面向文档数据库采集。它灵活的存储方式非常受青睐。
DataStax__:融资:1.9亿美元。细分行业:基于Apache Cassandra的数据库支持平台。客户包括eBay、Adobe、Netflix等
Couchbase__: 文档型数据库,高性能,在LinkedIn运维也推荐使用
FoundationDB__: 兼容事务处理的NoSQL
RethinkDB__: open-source, scalable database that makes building realtime apps dramatically easier.
RocksDB__: FB旗下的开源数据库类似LevelDB.org__设计
Presto__:FB旗下分布式SQL查询引擎
Hadoop
Hadoop 三剑客其中 Hortonworks 已经上市
Cloudrea__:融资:10.4亿美元。细分行业:大数据分析软件、服务与培训。今年,这家大数据巨头企业即将进入中国市场。
MapR__:融资:1.74亿美元。细分行业:大数据分析软件、服务与培训。它的创始团队来自Facebook、Google和Yahoo等公司
Altiscale__: 提供的Hadoop作为一种服务(HAAS)
Qubole__:Hadoop服务提供商,一些创业公司如Pinterest也是它的客户
Splice Machine__: 基于Hadoop的实时大数据技术公司,支持SQL 事务处理,并针对OLAP 和OLAP 应用进行实时优化处理
Continuuity__: a Hadoop-based big data application hosting platform.
Platfora__: Provide a big data analytics solution that transforms raw data in Hadoop into interactive, in-memory business intelligence.
Xplenty__: Provide HaaS.
Nuevora__: Provide Big Data analytics applications.
机器学习
Everstring__:通过不断地主动挖掘和分析全网在线企业信息,结合每家企业内部的客户关系管理系统,利用机器学习自动建立量化客户模型预测谁是下一个客户。
Luminoso__:自然语言处理和机器学习技术,帮助企业分析消费者在各种通讯渠道中讨论的话题
Dato__:GraphLab提供了一个完整的平台,从别的应用程序或者服务中抓取数据,让机器学习这个模型,并将学到的知识作为基础,自动地进行准确的预测和决策制定。
Paxata__:应用机器学习技术处理大数据难题
0xdata__:H2O 的算法是面向业务流程——欺诈或趋势预测
Numenta:__developed a cohesive theory, core software technology, and numerous applications all based on principles of the neocortex
PredictionIO__:开源的机器学习服务器
Alpine Data Labs__: 大数据预测分析
Zementis__: 预测分析决策管理平台
Trifacta__:人机交互数据分析平台
Metamind__: 提供相当完美的人工智能解决方案,这种解决方案主要由“深度学习(DL)”支持
RapidMiner__:数据挖掘工具
FiscalNote__: 数据挖掘软件和人工智能手艺预测立法机构的投票成果,从而判断某些议案可否通过。
BI工具和其他
Looker__:一个基于Web的BI平台,目前已以与Amazon Redshift、 Teradata Aster、HP Vertica、Greenplum、Impala、 BigQuery以及Spark等数据源进行集成;定制和复用数据可视化体验。
Confluent:__Kafka初创公司。
Databricks__:主要开发Spark。
Elasticsearch__:分布式搜索引擎,基于Lucene开发
Tachyon Nexus:__ 主要开发Tachyon。
Snowplow Analytics__:开放代码的分析平台,特别是基于AWS的分析。
Datameer__:开源的数据处理系统,用于构建强大的超级计算机廉价服务器集群。
DataSift__:社交数据分析公司
Datadog__:数据监控
Sumo logic__:日志管理过滤
Ginger.io:__ 为研究人员、物理学家和医疗保健人员提供相应的行为分析能力
Birst__ :从事商业智能和数据分析,利用云计算来颠覆传统的IT服务模式
Interana__:自助分析数据平台
gridgain__: 基于内存的大数据实时处理系统
Lucidworks__:Solr企业版
DataTorrent__ :可以将数据处理速度从实时提高至“现在时”
WibiData__:专业大数据软件包
Dataguise__:大数据安全公司
Aerospike__:开源NoSQL数据库,支持近实时数据分析
Accumulo__:可靠的、可伸缩的、高性能的排序分布式的Key-Value 存储解决方案,基于单元访问控制以及可定制的服务器端处理
Pentaho__:以工作流为核心的、强调面向解决方案而非工具组件的BI
Metamarkets__:可视化分析,帮助在线媒体公司分析高流量的流媒体数据
Pivotal__:一个以数据为核心的企业级PaaS平台
Pachyderm__:Dockerized MapReduce
Premise__:走众包数据采集途径向金融机构提供数据
Domo__:融资:2.5亿美元。细分行业:云商务智能。它的主要服务客户是企业用户,其数据库可以帮助企业维持日常的运转。
SumAll__:social media analytics and business dashboard
Tintri__:“智能混合闪存”,混合了闪存和计算机硬盘驱动器
Datarella:__Big Data Strategy & Product Development
Snowflake__:云数据仓库
GoodData__:融资:1.01亿美元。细分行业:云商务智能。GoodData向SaaS供应商提供技术集成服务,在平台内获得分析数据。
Amplitude__:BI分析软件
Mu Sigma__: 融资:1.95亿美元。细分行业:大数据科学服务。这是一家向企业客户提供数据分析和决策支持服务的研究公司。
Mixpanel__:有web和移动分析平台,其提供的服务可以分析监测用户活动
DataHero__:打着“你的数据你做主”的口号,试图弥合大数据同普通用户之间的鸿沟,即帮你分析跟你密切相关的数据
Opera Solutions__融资:1.22亿美元。细分行业:大数据科学服务。其提供的大数据服务可以一次性采集数十亿条数据。
Guavus__ 融资:1.07亿美元。细分行业:智能解决方案平台。它的主要投资方是英特尔。
Kissmetrics__:分析服务公司
treasuredata__: 提供大数据存储,查询,分析云服务
Quantcast__: 大数据广告公司
Spagobi__: BI 开源工具
Zoomdata__: 大数据可视化展示
Birst__:商业智能和数据分析,安全性隔离性
Clearstory__:大数据分析服务商,帮助企业和客户收集、处理、分析数据
Actian__:深藏不露的数据库公司。目前其年收入大约为1.5 亿美元。对 ParAccel 的收购已经是过去5 个月中Actian 进行的第四笔收购
Eclipse BIRT__: Eclipse旗下数据可视化
Netezza Analytics__: IBM 旗下数据仓库
DataGravity__: software-based company engaged in the IT industry and is focused on providing data management services.
Zipfian Academy__:Data Science Bootcamp
Civis Analytics__:big data analytics firm that helps companies, non-profits, and campaigns leverage their data to develop smarter strategy.
Quid__: Business Analytics Software
inPowered__:discover the most engaging content written about them and turn them into native ads that are promoted across the web, mobile apps
Cask.co__:helps developers and organizations deliver Hadoop solutions more quickly and effectively with the open source
Tamr__:quickly, efficiently and cost-effectively connects and enriches all of your internal or external data sources
ScalingData__/Rocana__: building software for large scale machine data (logs, metrics, etc.) and event management, specifically in the domain.
Ayasdi__: use mathematics theory to find potential patterns in data and visualize them as geometric shapes
下面是来自Bo Yang的总结
从对美国大数据市场的调研来看,我们可以得到一些启示:
-
美国的数据分析市场非常大,容纳超过百家公司,这得益于美国信息化的高度发达。
-
虽然有很多公司,但是大家很少有重复竞争,每一家都有自己的特色,在自己的领域内发展,这也符合美国公司注重差异化相关。
-
传统的商务数据分析公司在维持旧有客户和平台的情况下,在积极向大数据技术扩展。
-
新兴的大数据技术发展非常快,但是目前还没有到成熟阶段,除了Hadoop之外,没有其他统一的技术被各家公司采用。
-
新的大数据技术趋势是快速响应,开始追求数据的实时处理和快速查询。
相对于美国市场,中国的大数据市场还处于非常初期的阶段,这可能跟中国的信息化程度相关。做长期展望预测,如果中国的信息化发展到美国的阶段,并且公司普遍采用基于数据的量化决策机制,将会迎来一个大数据发展的爆发式增长。
参考链接
如非注明转载, 均为原创. 本站遵循知识共享CC协议,转载请注明来源