摘要: GBDT和xgboost在競賽和工業界使用都非常頻繁,能有效的應用到分類、回歸、排序問題,雖然使用起來不難,但是要能完整的理解還是有一點麻煩的。本文嘗試一步一步梳理GB、GBDT、xgboost,它們之間有非常緊密的聯繫,GBDT是以決策樹(CART)為基學習器的GB算法,xgboost擴展和改進了GDBT,xgboost算法更快,準確率也相對高一些。

摘要: 近日,有越來越多的學者正在探討機器學習(和深度學習)的侷限性,並試圖爲人工智能的未來探路,紐約大學教授 Gary Marcus 就對深度學習展開了系統性的批判。此前,圖靈獎獲得者,UCLA 教授 Judea Pearl 題爲《Theoretical Impediments to Machine Learning with Seven Sparks from the Causal Revolution》的論文中,作者就已探討了當前機器學習存在的理論侷限性,並給出了面向解決這些問題,來自因果推理的七個啓發。Pearl 教授在 NIPS 2017 系列活動中對本文進行了討論,隨後,他也對一些人們關心的問題進行了解答。

摘要: 近日南洋理工大學研究者發佈了一篇描述卷積網絡數學原理的論文,該論文從數學的角度闡述整個卷積網絡的運算與傳播過程。該論文對理解卷積網絡的數學本質非常有幫助,有助於讀者「徒手」(不使用卷積API)實現卷積網絡。

摘要: 在今年的 EMNLP 2017 上,臺灣大學黃意堯與加州聖塔芭芭拉大學 (UCSB)William Wang 教授有一篇合作論文被錄用。黃意堯撰寫了關於這篇論文的研究歷程,以供學習與參考。我們做了不改動原意的編輯與修改,將繁體字轉換爲簡體,並將一些臺灣常用表述轉換爲大陸的通用說法。

摘要: 一想數據管理世界中的那個偉大的存在–數據倉庫吧。在過去的二十年中,儘管其他的系統和軟件在許許多多的迭代、變革中演進,甚至完全被新模型所拋棄,數據倉庫這個老骨幹卻安然屹立。她可能會偷偷地給自己的面頰,皺紋整容,也可能會激起一些不那麼令人深刻的模仿,但是沒有什麼能長期的吸引她的注意力。 直到現在。自從Hadoop出現在舞台上之後,一直有人嘀咕說,這個閃亮的新星正在為一些最好的數據管理角色提供服務–這些角色就是,在幾年前,數據倉庫已穩操勝券。 但是現在真的到了數據倉庫要退休的時候了嗎?Hadoop甚至想要進入她的鞋子裡嗎?還有誰在後面等著呢? 讓我們仔細看看這些據報導的競爭對手的全部本領。

摘要: 本文對「範例卷積神經網絡」的訓練方法僅作了簡單簡單的概述,所以如果想要獲得更多、更真實的信息,請閱讀論文原文。本文簡要介紹了「變分信息最大化」,並將其運用到了「範例卷積神經網絡」的案例中。我們在案例中只使用了一個數量適中的訓練圖像集,「範例卷積神經網絡」恰恰利用了這一點,把數據分佈表示爲一個經驗分佈(離散有限可能性的分佈)。

Popular Tags

每月文章