摘要: 幾個月前,TensorFlow 發佈了梯度提升方法的調用接口,即 TensorFlow 提升樹(TFBT)。不幸的是,描述該接口的論文並沒有展示任何測試效果和基準的對比結果,所以 Nicolò Valigi 希望能對 TFBT 和 XGBoost 做一個簡要的對比,並分析它們之間的性能差異。我們介紹了該測試與 TFBT 的原論文,且 TF 1.4 及以上的版本也可測試該提升樹模型。

摘要: 詞向量算法是自然語言處理領域的基礎算法,在序列標註、問答系統和機器翻譯等諸多任務中都發揮了重要作用。詞向量算法最早由谷歌在2013年提出的word2vec,在接下來的幾年裏,該算法也經歷不斷的改進,但大多是僅適用於拉丁字符構成的單詞(比如英文),結合中文語言特性的詞向量研究相對較少。本文介紹了螞蟻金服人工智能部與新加坡科技大學一項最新的合作成果:cw2vec——基於漢字筆畫信息的中文詞向量算法研究,用科學的方法揭示隱藏在一筆一劃之間的祕密。

摘要: Google Finance no longer provides data for historical prices or financial statements, so we say goodbye to getSymbols.google() and getFinancials.google(). (#221) They are now defunct as of quantmod 0.4-13.

摘要: Ryan Dahl, the founder of Node.js, shared his thoughts over the year participating in Google Brain Residency Program.

摘要: GBDT和xgboost在競賽和工業界使用都非常頻繁,能有效的應用到分類、回歸、排序問題,雖然使用起來不難,但是要能完整的理解還是有一點麻煩的。本文嘗試一步一步梳理GB、GBDT、xgboost,它們之間有非常緊密的聯繫,GBDT是以決策樹(CART)為基學習器的GB算法,xgboost擴展和改進了GDBT,xgboost算法更快,準確率也相對高一些。

摘要: 越來越多的平台型企業和金融機構開始重新認識區塊鏈技術,基於區塊鏈底層邏輯、技術、算法、機制創新各類產品且將之應用於各種「區塊鏈+財資」的場景中,並取得了實效,成為領先的實踐者。

摘要: 機器學習與人工智慧變得越來越熱。大數據原本在工業界中就已經炙手可熱,而基於大數據的機器學習則更加流行,因為其通過對數據的計算,可以實現數據預測、為公司提供決策依據。

摘要: 神經網絡是功能強大而又靈活的模型,在圖像,語音以及自然語言理解等學習任務上有良好的效果。儘管神經網絡很成功,但設計一個好的神經網絡仍然十分困難。為了能夠使設計神經網絡變得簡單,谷歌大腦團隊發表了一篇名為《Neural architecture search with reinforcement learning》的文章,該文章使用循環網絡來生成神經網絡中的模型描述,並用強化學習訓練這個RNN,以最大限度的提高驗證集中生成的架構的準確性。

熱門標籤雲

每月文章