導語:讀讀董老師的文章,漲漲姿勢。
這里面創(chuàng)業(yè)公司太多了,包含BI工具,數(shù)據(jù)存儲和挖掘,應用等,我就簡單說一些我感興趣的,它們大多在硅谷,其他的可以參考。更新是到2015年6月。
Palantir:融資:9.5億美元。150億美金估值,已經(jīng)是超級獨角獸單獨列出來。Peter Thiel創(chuàng)辦大數(shù)據(jù)公司。數(shù)據(jù)集成、 信息管理和定量的分析。連接到商業(yè)、 專有和公共數(shù)據(jù)集,并發(fā)現(xiàn)趨勢、 關系和異常,包括預測分析。
##############
Database
MemSQL: 號稱最快的內(nèi)存數(shù)據(jù)庫。
GraphSQL:高效、大容量的圖形數(shù)據(jù)庫和分析平臺,創(chuàng)始人是國人。
MongoDB: 融資:3.11億美元。細分行業(yè):面向文檔數(shù)據(jù)庫采集。它靈活的存儲方式非常受青睞。
DataStax:融資:1.9億美元。細分行業(yè):基于Apache Cassandra的數(shù)據(jù)庫支持平臺??蛻舭╡Bay、Adobe、Netflix等
RethinkDB: open-source, scalable database that makes building realtime apps dramatically easier.
Hadoop
Hadoop 三劍客其中 Hortonworks 已經(jīng)上市
Cloudrea,融資量:10.4億美元。細分行業(yè):大數(shù)據(jù)分析軟件、服務與培訓。今年,這家大數(shù)據(jù)巨頭企業(yè)即將進入中國市場。
MapR:融資量:1.74億美元。細分行業(yè):大數(shù)據(jù)分析軟件、服務與培訓。它的創(chuàng)始團隊來自Facebook、Google和Yahoo等公司
Altiscale: 提供的Hadoop作為一種服務(HAAS)
Qubole:Hadoop服務提供商,一些創(chuàng)業(yè)公司如Pinterest也是它的客戶
Splice Machine: 基于Hadoop的實時大數(shù)據(jù)技術公司,支持SQL 事務處理,并針對OLAP 和OLAP 應用進行實時優(yōu)化處理
Continuuity: a Hadoop-based big data application hosting platform.
Platfora: Provide a big data analytics solution that transforms raw data in Hadoop into interactive, in-memory business intelligence.
Xplenty: Provide HaaS.
Nuevora: Provide Big Data analytics applications.
機器學習
Everstring:通過不斷地主動挖掘和分析全網(wǎng)在線企業(yè)信息,結(jié)合每家企業(yè)內(nèi)部的客戶關系管理系統(tǒng),利用機器學習自動建立量化客戶模型預測誰是下一個客戶。
Luminoso:自然語言處理和機器學習技術,幫助企業(yè)分析消費者在各種通訊渠道中討論的話題
Dato:GraphLab提供了一個完整的平臺,從別的應用程序或者服務中抓取數(shù)據(jù),讓機器學習這個模型,并將學到的知識作為基礎,自動地進行準確的預測和決策制定。
Paxata:應用機器學習技術處理大數(shù)據(jù)難題
0xdata:H2O 的算法是面向業(yè)務流程——欺詐或趨勢預測
Numenta:developed a cohesive theory, core software technology, and numerous applications all based on principles of the neocortex
PredictionIO:開源的機器學習服務器
Alpine Data Labs: 大數(shù)據(jù)預測分析
Zementis: 預測分析決策管理平臺
Trifacta:人機交互數(shù)據(jù)分析平臺
Metamind: 提供相當完美的人工智能解決方案,這種解決方案主要由“深度學習(DL)”支持
RapidMiner:數(shù)據(jù)挖掘工具
BI工具和其他
Looker:一個基于Web的BI平臺,目前已以與Amazon Redshift、 Teradata Aster、HP Vertica、Greenplum、Impala、 BigQuery以及Spark等數(shù)據(jù)源進行集成;定制和復用數(shù)據(jù)可視化體驗。
Confluent:Kafka初創(chuàng)公司。
Databricks:主要開發(fā)Spark。
Elasticsearch:分布式搜索引擎,基于Lucene開發(fā)
Tachyon Nexus: 主要開發(fā)Tachyon。
Snowplow Analytics:開放代碼的分析平臺,特別是基于AWS的分析。
Datameer:開源的數(shù)據(jù)處理系統(tǒng),用于構(gòu)建強大的超級計算機廉價服務器集群。
DataSift:社交數(shù)據(jù)分析公司
Datadog:數(shù)據(jù)監(jiān)控
Sumo logic:日志管理過濾
Ginger.io: 為研究人員、物理學家和醫(yī)療保健人員提供相應的行為分析能力
Birst :從事商業(yè)智能和數(shù)據(jù)分析,利用云計算來顛覆傳統(tǒng)的IT服務模式
Interana:自助分析數(shù)據(jù)平臺
Lucidworks:Solr企業(yè)版
DataTorrent :可以將數(shù)據(jù)處理速度從實時提高至“現(xiàn)在時”
WibiData:專業(yè)大數(shù)據(jù)軟件包
Dataguise:大數(shù)據(jù)安全公司
Aerospike:開源NoSQL數(shù)據(jù)庫,支持近實時數(shù)據(jù)分析
Accumulo: 可靠的、可伸縮的、高性能的排序分布式的Key-Value 存儲解決方案,基于單元訪問控制以及可定制的服務器端處理
Pentaho:以工作流為核心的、強調(diào)面向解決方案而非工具組件的BI
Metamarkets:可視化分析,幫助在線媒體公司分析高流量的流媒體數(shù)據(jù)
Pivotal:一個以數(shù)據(jù)為核心的企業(yè)級PaaS平臺
Pachyderm:Dockerized MapReduce
Premise:走眾包數(shù)據(jù)采集途徑向金融機構(gòu)提供數(shù)據(jù)
Domo:融資量:2.5億美元。細分行業(yè):云商務智能。它的主要服務客戶是企業(yè)用戶,其數(shù)據(jù)庫可以幫助企業(yè)維持日常的運轉(zhuǎn)。
SumAll:social media analytics and business dashboard
Tintri:“智能混合閃存”,混合了閃存和計算機硬盤驅(qū)動器
Datarella:Big Data Strategy & Product Development
Snowflake:云數(shù)據(jù)倉庫
GoodData:融資:1.01億美元。細分行業(yè):云商務智能。GoodData向SaaS供應商提供技術集成服務,在平臺內(nèi)獲得分析數(shù)據(jù)。
Amplitude:BI分析軟件
Mu Sigma: 融資量:1.95億美元。細分行業(yè):大數(shù)據(jù)科學服務。這是一家向企業(yè)客戶提供數(shù)據(jù)分析和決策支持服務的研究公司。
Mixpanel:有web和移動分析平臺,其提供的服務可以分析監(jiān)測用戶活動
DataHero:打著“你的數(shù)據(jù)你做主”的口號,試圖彌合大數(shù)據(jù)同普通用戶之間的鴻溝,即幫你分析跟你密切相關的數(shù)據(jù)
Opera Solutions融資量:1.22億美元。細分行業(yè):大數(shù)據(jù)科學服務。其提供的大數(shù)據(jù)服務可以一次性采集數(shù)十億條數(shù)據(jù)。
Guavus 融資量:1.07億美元。細分行業(yè):智能解決方案平臺。它的主要投資方是英特爾。
DataGravity: software-based company enGAged in the IT industry and is focused on providing data management services.
Zipfian Academy:Data Science Bootcamp
Civis Analytics:big data analytics firm that helps companies, non-profits, and campAIGns leverage their data to develop smarter strategy.
Quid: Business Analytics Software
inPowered:discover the most engaging content written about them and turn them into native ads that are promoted across the web, mobile apps
Cask.co:helps developers and organizations deliver Hadoop solutions more quickly and effectively with the open source
Tamr:quickly, efficiently and cost-effectively connects and enriches all of your internal or external data sources
ScalingData/Rocana: building software for large scale machine data (logs, metrics, etc.) and event management, specifically in the domain.
Kissmetrics:分析服務公司
10 Hot Big Data Startups to Watch in 2015 from A to Z
10 Hot Hadoop Startups to Watch