摘要: Python 是一門更注重可讀性和效率的語言,尤其是相較於Java,PHP 以及C++ 這樣的語言,它的這兩個優勢讓其在開發者中大受歡迎。


作者:車品覺

  1. 問題在於,如何使它可行?這一點非常重要。是只搞分析研究,還是只做一種產品?是向對沖基金收取服務費,還是和一支對沖基金合夥?是被對沖基金吸收,還是提供交易信號?是從事諮詢工作,還是創建自己的對沖基金?所有這些潛在的商業模式我們都曾經考慮過。
  2. 機器學習算法能不斷進化,真正著眼於市場配置,對不同置信水平的買賣信號進行分類。這有點像一個交易大廳,裡面有很多交易員,就我們的情況來說則是有很多機器交易員,它們是一個個AI算法,然後有一位投資組合經理,擔任資金的分配者,使用不同AI算法提供的潛在交易信號,根據風險約束和敞口約束、多頭和空頭、工具、地域等因素,對分配給那些信號的資金進行優化。
  3. 在AI和大數據之間,我們作了區分,但其他人往往沒有這麼做。AI是一種讓你發掘大數據價值的手段,但我們的重心放在AI取得的進步上。例如,當AI變身圍棋大師和雅達利公司(Atari)系列遊戲的高手時,這些其實都是算法所取得的進步。

原文翻譯:

金融市場提供了無數種賺錢(或者虧錢)的方法。它們之間的一個重要區別就是投資期限,從幾毫秒到幾年不等。胡桃算法(Walnut Algorithms)和全球系統投資者(Global Systematic Investors)是兩家新型投資管理公司,分別是高頻交易界和低頻交易界的代表。我採訪了這兩家公司的創始人,跟他們聊了聊投資、數據和創業挑戰。本篇是我和胡桃算法公司聯合創始人兼首席執行官紀堯姆·維達爾(GuillaumeVidal)的對話,後續發布的下篇將是對全球系統投資者公司聯合創始人兼聯合首席投資官博爾德·漢克(Bernd Hanke)的採訪。

你們為什麼給公司取名“胡桃算法”?

維達爾:因為胡桃的形狀像大腦,而且從創業公司的角度來看,前有蘋果和黑莓,今有胡桃,感覺會很有趣。這個名字還是為了表示,我們有點像智能算法創造出來的胡桃樹。我們覺得,把“算法”放在“胡桃”後面很重要。“胡桃”和“算法”的組合很有意思,寓意也很好。

你會如何概括你們的工作?

維達爾:我們把最先進的人工智能應用在系統投資策略上。

這是一開始的想法,還是後來產生的?

維達爾:我覺得自然而然就有了這個想法。六位聯合創始人擁有人工智能、投資管理和金融背景,我們認為肯定有發揮我們專長的地方。我們研究了很多AI創業公司,發現其中很多公司都在努力思索他們應該用AI來做些什麼。法國有一家優秀的AI創業公司,名叫Snips,就連他們都是好不容易才想出一款產品。從一開始,我們就著眼於金融服務和投資管理,我們覺得這非常適合用AI來處理。我們確實花了點時間來尋找合適的商業模式,我們現在的答案其實就是根據監管的規定來管理資金和提供投資建議。但在剛開始的時候,我們有點天真地想:“我們要運用AI。”我們希望做到像DeepMind公司利用強化學習和AlphaGo所做的那些成果。這些算法極為強大,我們希望把它們用在投資管理上,而這些算法最多才問世四、五年。要能對它們善加利用,不僅需要AI領域的進步,也需要其他領域的進步:對數據的獲取,擁有恰當函數庫的編程語言,以還有通過谷歌云或亞馬遜雲服務提供的算力。需要綜合好多方面才能做到這一點。我覺得,對我們來說最困難可能也是最幸運的地方在於,我們擁有這樣的綜合技能。我認為,最大的門檻就是AI、計算機科學、量化金融和商業技能的結合。

你們專注於哪些金融工具?

維達爾:我們專注於美國和歐洲的高流動性股票指數期貨,因為我們既需要流動性,也需要很低的交易成本,做多或做空時不必支付額外成本。

你們是如何找到你們的商業模式的?

維達爾:我們先是認定AI用於金融是可行的。這肯定能行,毫無疑問。問題在於,如何使它可行?這一點非常重要。是只搞分析研究,還是只做一種產品?是向對沖基金收取服務費,還是和一支對沖基金合夥?是被對沖基金吸收,還是提供交易信號?是從事諮詢工作,還是創建自己的對沖基金?所有這些潛在的商業模式我們都曾經考慮過。我們申請加入創業加速器Startup Bootcamp,在甄選階段中,我們對他們說,我們還沒有找到一種商業模式。他們對此並不介意。現在,我們在從獨立管理賬戶入手。這在金融業已經相當規範化了。很多商品交易顧問(CTA)都在做這個。基金架構可能是要到更晚些才會著手的工作,因為會涉及到更多的合規和監管問題,成本會更高,也很耗時間。

用機器學習來生成交易信號有什麼創新之處?

維達爾:傳統的系統策略是基於規則的。比如,你在Quantopian平台上編寫一個系統策略,規定:“如果這三條移動平均線發生交叉,那麼這個交叉點就是我的年度樞軸點。或者,如果我的相對強弱指標超過了特定的某個閾值,那麼我就買進或賣出。”這些都是固定的規則。而我們所打造的,是一種沒有固定規則、更加靈活的機器。機器學習算法能不斷進化,真正著眼於市場配置,對不同置信水平的買賣信號進行分類。這有點像一個交易大廳,裡面有很多交易員,就我們的情況來說則是有很多機器交易員,它們是一個個AI算法,然後有一位投資組合經理,擔任資金的分配者,使用不同AI算法提供的潛在交易信號,根據風險約束和敞口約束、多頭和空頭、工具、地域等因素,對分配給那些信號的資金進行優化。

似乎你們的客戶必須對AI 足夠精通到才能懂得你們工作的價值,但又不能精通到有能力自己做。

維達爾:全球有8萬多支基金。其中自然總會有一些對AI感興趣,甚至還有對沖基金直接找上我們。但有些時候,他們只有一套全球宏觀策略、一套債券策略或者其他某種形式的非系統策略。我認為,內部金融工程師團隊未必有充足的人手,來做我們一直在做的事。

以前,我們的所有代碼就靠12個人來寫,現在很快就要增加到15個人了,全都是科學家。我們得把整個基礎架構的代碼都寫出來,我們還得做分析研究,所有事情都得我們自己來做。很多傳統基金有時會聘請一位博士,然後說:“就讓他負責解決某一個問題,就讓他用機器學習加強我們的其中一個系統。”這未必行得通,因為你可能還需要創業公司身上的那種協作和創新文化,而不是臨時聘請一位博士,與基金裡的一位金融工程師合​​作,進行數據科學方面的工作。我們就完全是在一個緊密的團隊里工作,一直在集思廣益,讓計算機科學家、數學家、AI專家一起思考什麼真正有效,什麼應該可行,我們應該如何用代碼實現,我們應該如何設計。這需要創新思維。

成熟的對沖基金一直以來用的都是自己的系統,可能能有20年那麼久。他們有自己的策略,可能是長期系統策略,長期趨勢跟踪策略或者其他什麼策略,他們會很難提出全新的東西、僱用新型員工、引入內部研究。有的也會作此嘗試。可以說,其中最精通AI的對沖基金取得了成功,比如Renaissance Technology、TwoSigma和Winton。這個行業很不透明,我們未必清楚地知道誰在做什麼,但可能他們有某種AI策略。

這些對沖基金的算法將在市場上和你們的算法產生競爭。你們是否有辦法應對?

維達爾:我認為主要有兩點。一是我們暫時比他們小得多,我們所關注的資產類別也未必相同。規模更大的對沖基金肯定處於程度非常深、流動性非常強的市場。這些基金很可能有大為不同的投資策略,多種多樣的投資期限,所以他們能夠進行從高頻交易到年度趨勢跟踪的各種投資。當你的資產管理規模達到600億美元時,你別無選擇,只能把投資範圍擴大到所有資產。而我們一開始的資產管理規模很小,我們可以對特定資產採取日內交易策略。

二是CTA的趨勢跟踪系統通常具有80%到90%的相關性,因為它們會在同樣的時間區間跟踪同樣的趨勢。當你開始使用更加複雜的機器學習策略時,實際運用機器學習的方式可以有很多。我們想到的是模塊化,所以我們會有數據採集、數據清理、特性工程、入場點和退出政策,有配置,有市場影響。所有這些對我們來說都可以利用機器學習進行改進,實現自動化,而可以用來做到這些的具體方法實在太多,所以最終大家各自做出來的系統會有很大的不同。我們提供了一些新的投資方法,我們提供的一些交易信號不是人人都有的。這並不是說我們的機器是會下金蛋的鵝,只賺錢不虧錢。它也有風險調整後收益,也有回撤,也有內在風險,但從投資組合管理策略的角度來看,它的表現確實超過了其他的一些絕對回報策略,並且和它們沒有相關性。這就是人們感興趣的地方。

 你是否擔心你們的模型過度擬合,在你們開發模型的時候奏效,但後來就不行了?

維達爾:盡可能地減少過度擬合正是我們的工作重點所在。方法有很多。首先是數據維度,這就是我們進行日內交易的原因。我們試圖掌握盡量多的數據點。在進行分類時,我們最大程度地減少特性向量,這實際上就是為了減少輸入數據維度。在這方面,運用人類專家的知識很重要。我們還開展大量的魯棒性測試,設計魯棒性模塊。在系統上線之前,我們也會進行虛擬交易。但某種程度的過度擬合總是存在的。因為你會使用歷史數據,並且會讓你的模型去擬合歷史數據,這時就會產生過度擬合。一些擬合是有用的,因為你必須確保算法擬合當前的市場機制,但算法必須得經過泛化處理。

你們的算法能否意識到機制已經改變,還是需要人類的幫助?

維達爾:能,我們做到了這一點的自動化。我們非常努力地在決策的多個層面實現自動化,不管是配置部分還是入場信號部分。所以底層算法本身可能知道市場已經改變,並據此調高或降低信號的置信水平。但在配置方面,你可能會說:“某個算法給我發了某個信號,但我決定無視它,因為它並不符合正確的機制。”因此,我們其實在多個層面都考慮到了機制變化。我們完全沒有引入人類干預,除非發生重大事件,比如嚴重的金融危機或者閃電崩盤時,我們認為,這時算法可能無法正常生效了,我們應該把它完全關閉。

你是否認為未來的投資管理將被AI 主導?

維達爾:這個很難說,但投資組合管理人或者對沖基金負責人,可能會從原本的交易員、經濟學家、商業人士群體,轉向數據科學家、數學家,轉向能夠利用數據、理解數據、管理科學家和工程師團隊的人群。鑑於AI正在變得更加容易獲取,數據和算力也在變得更加容易獲取。你可能會看到像我們這樣的公司不斷湧現,並且顛覆規模更大的對沖基金,而從某種意義上說,屆時那些規模更大的對沖基金將被迫捍衛自己的地位,要么收購我們這樣的公司,要么自己創新,就因為他們現在沒有真正做到這一點。

你是否認為,在未來的某個時候,應用於投資領域的AI 將會商品化?

維達爾:AI不是自動的,不是單一架構。它不是“我做AI”這麼簡單。我不認為AI將完全商品化。這不像是“我有個AI算法,把數據輸進去,它就能工作”。實際情況要復雜得多。你必須進行大量的特性工程,你必須擁有交易經驗和市場經驗,當中涉及到很多不同的參數和很多不同的方法。也許會有某種形式的商品化,比如Quantopian平台在一定程度上成功實現了系統算法編寫的商品化,吸引了很多人。但相比那些使用的都是同一個平台、獲取的都是同樣的特性與數據的人群,使用另一個不同平台的人群可能會更有優勢。

這又把我們帶回了AI 交易團隊理想構成的話題。

維達爾:你需要交易老手、數據科學家和計算機專家,在基礎設施、代碼優化和執行方面,你都需要出色的IT人員。對我們來說,數據科學和AI差不多是一回事,但AI從業人員不同於AI研究人員。數據科學家知道如何寫代碼,知道如何使用機器學習函數庫,而研究人員明白神經網絡背後的真正原理,也許他們會致力於重寫一個性價比更高的函數之類的,這就不是數據科學家會幹的事。

當這些背景不同的人在如何進行下一步工作的問題上產生分歧,又會是種什麼局面?

維達爾:這很重要。我認為正是這一點令我們與眾不同——整個團隊的成員都是思想開放、能夠整天爭論的人,然後由最好的想法勝出。這是創造力管理,試圖讓所有人在一開始的時候提出不同看法,最後達成共識。也要在優先事項上達成共識,因為我們總是有許許多多的想法,一一實施的話需要無數的人手和時間。我們必須確定,哪些最容易實現?我們現在只要做些什麼就能最大限度地改進結果?然後,會有更側重於技術的人員說“沒問題,我能實現這部分的代碼”、“這個要實現起來,需要寫的代碼會太長”或者“這部分我們該怎麼用代碼來實現? ”

你對非傳統數據來源大數據有何看法?

維達爾:在AI和大數據之間,我們作了區分,但其他人往往沒有這麼做。AI是一種讓你發掘大數據價值的手段,但我們的重心放在AI取得的進步上。例如,當AI變身圍棋大師和雅達利公司(Atari)系列遊戲的高手時,這些其實都是算法所取得的進步。這些都只是規模很小的數據集或者相當有限的數據集,但是真正取得了進步的是AI本身。我們的重心是強大的AI,而不是另外的數據來源。其中一個原因就是我談到的數據維度問題。我們尋求的是在統計意義上足夠穩健的策略。

其他行業對數據科學家的需求很大。你們如何吸引數據科學家到金融業工作?

維達爾:首先,我們把自己宣傳為一家科技公司。而且所有在金融AI方面取得成功的企業和基金其實都是這麼做的。看看Two Sigma、Winton和Renaissance Tech的宣傳,他們實際上是在說“我們是一家科技公司,一家研究公司,只是碰巧從事金融交易”。這對吸引適當人才非常重要。如果你只是一家對沖基金,人們不會真的願意為你工作,主要原因就是金融危機的影響和對沖基金行業的糟糕名聲。但這份工作其實相當有意思。你會分析非常複雜的數據集。你會做各種研究,並且會有非常明確直接的應用。結果是好是壞,一試即知,黑白分明。優化代碼,把數據科學應用於新的數據集、新的策略、新的市場和新的工具,每天都做著這樣的工作,其實是很有意思的,可能要比在媒體公司做類似的工作更有意思。從長遠來看,比如五到後,我們希望能拓展到其他領域。位於紐約的對沖基金Renaissance Tech,就被視為世界上最出色的理論物理實驗室之一。同樣,我們希望胡桃算法公司能成為世界上最出色的AI實驗室之一。

轉貼自: 36大數據


留下你的回應

以訪客張貼回應

0

在此對話中的人們

Popular Tags

每月文章