機器學習賦能構建多元量化體系
量化投資,是一種使用數據和模型算法來進行投資決策的投研方法。和主動選股以深度取勝不同,量化投資通常憑借廣泛的覆蓋和分析來總結普適性的規律。有兩個因素至關重要:一是有多年經驗的“船長”把握方向,知道哪里“有魚”;二是有來自相關領域的專才,共同搭建高效的“捕魚網”。
廣發基金總經理助理陳少平,就是一位善于把握航行方向的“船長”。作為一名經驗豐富的投研老將,她先后在研究員、研究總監、聯席CIO、基金經理等崗位歷練。如今,她憑借著善于研究和總結證券市場發展規律的優勢,基于量化業務先進經驗,帶領廣發基金量化部持續探索前沿的發展方向。
“通過研究量化業務的發展趨勢,我發現高頻因子、另類數據以及人工智能(AI)技術,已經在業內得到越來越廣泛的應用。”陳少平介紹,廣發基金量化投資部較早布局AI和機器學習方面,逐漸構建起多元量化體系。她相信,未來量化投資將更加智能化、精準化,團隊也將繼續向另類因子及機器學習的方向拓展。
去“有魚”的地方
中國證券報:你在基本面研究方面深耕多年,分管量化投資后,過往的這些經驗如何賦能量化團隊?
陳少平:確實,我在主觀研究方面做了很多年,在研究、總結市場的發展規律方面積累了一些經驗,可以運用在量化研究上。一方面,為團隊提供方向性的判斷。從多年投研經驗來看,我認為研究事物的發展規律很重要。因此,我深入研究了量化業務在海內外的發展路徑,并結合自身在基本面研究上的積累,爭取幫助團隊把握大方向,就像芒格說的“去有魚的地方捕魚”。比如在今年初,我建議團隊要加大對于紅利因子的研究力度,上半年紅利資產表現優異,為我們的產品業績做出了正向貢獻。
另一方面,積極引進先進技術和人才。通過研究量化業務的趨勢,我發現,高頻因子、另類數據以及人工智能技術,已經在業內得到越來越廣泛的應用。因此,廣發基金量化投資部較早對AI和機器學習方面進行布局,并積極進行實踐探索,為提升策略有效性帶來了較好的效果。
中國證券報:根據你的研究,目前業內如何運用AI和機器學習技術?
陳少平:具體來看,目前業內運用機器學習技術的量化策略主要在于兩個方向:一是協助挖掘因子,顯著提升工作效能;二是整合因子打分,為制定策略權重提供支持。
不同團隊在AI技術的細節處理上存在差異,包括模型設計、架構搭建、數據預處理和目標函數選擇等方面,都需要深入研究和經驗積累。在上述方面,廣發基金量化投資部已經逐步積累了自身的優勢。
中國證券報:能否展開說,廣發基金量化投資部如何在投研中體現先進性?
陳少平:一方面,團隊在數據源方面引入了另類數據。隨著技術的發展和進步,可獲取的數據越來越豐富,另類數據的使用將極大提升模型的選股能力,充分利用人工智能技術和先進的計算架構,可以提升選股模型的預測準確度,充分拓展量化分析框架的廣度和深度。
另一方面,在2023年以來的AI科技風口之下,團隊對機器學習進行密切關注和深度研究。機器學習等技術更有助于挖掘一些非線性的因子,對于之前的技術來說,這些因子是比較難以捕捉的。此外,傳統的因子復合方法往往采用線性加權的方式,而機器學習則采用非線性的“腦回路”,能提供更高效的整合策略,有助于獲得超額投資收益。
捕捉長期有效因子
中國證券報:近一兩年,主動投資和量化投資逐漸融合,從你的研究體會來看,這兩者各有什么特色?
陳少平:從投資方法看,量化與主觀投資被認為是兩種涇渭分明的方式。主觀投資是基于主觀判斷和邏輯推演的基本面投資,而量化投資則是依賴于大數據分析、數理統計和自動化技術處理海量信息。
根據我對歷史行情的觀察,主動投資整體在大盤占優、成長占優的市場風格下表現更出色;量化產品則整體在小盤占優、價值占優時能獲得較好表現。可以說,量化投資在風格和賽道上天然適合作為主動投資的補充。
中國證券報:相比主動投資,量化投資如何獲取超額收益?
陳少平:相對來說,量化投資擅長融合來自不同維度的信息,憑借信息廣度的優勢從眾多潛在的市場機會中捕捉到勝率更高的部分,迅速做出交易決策,從而獲取長期穩健的超額收益。
在量化選股的過程中,傳統因子用得越多,有效性就越差。因此,量化投資要做得好,核心是捕捉到市場上長期有效的因子,就像是挖礦一樣,要求使用有邏輯、有規律、有基本面支撐的思路去設計策略。也就是說,量化投資的超額收益并不是來自模型或者算力的簡單堆積,而是來自于對金融數據的深刻理解。
我認為,量化投資要取得長期穩健的超額收益,需要做到以下三點:一是投研緊密配合,研究員在細分方向深入挖掘因子;二是不求極致,而是以穩致勝;三是要有耐心,積累長期業績。
中國證券報:在具體實踐中,廣發基金量化投資部如何體現“對金融數據的深刻理解”?
陳少平:首先,我們堅持每一個因子和模型的設計都必須有邏輯、可解釋,注重構建邏輯和金融學意義,對過度數據挖掘產生的因子保持謹慎,這樣也會降低模型風險。
其次,我們堅持的是價值投資理念,對基本面賦予較高權重,在因子選用和模型設計上均側重穩定性。例如,團隊在機器學習模型的開發中,配置了較高比例的基本面因子,使得模型的中長期預測更為穩定,能夠達到較高的勝率。
第三,通過對因子風格特征的鉆研,我們開發了多種具有獨創性和差異性的量化選股模型,超額信息來源涵蓋基本面數據、交易面數據、另類數據等,為策略提供了長期而持續的生命力。基于策略的獨創性和可解釋性,在面對市場回撤時,團隊能夠保持冷靜,深入剖析策略效果受到影響的原因和優化方法。
多維度提升綜合能力
中國證券報:這些年,資管行業的競爭很激烈,你認為做好量化投資需要具備哪些核心能力?
陳少平:在量化投資中,數據源的多元化、低相關因子的充分儲備、模型的多樣性都非常重要,能夠提升選股模型的準確度,更好地應對不同的市場環境,也是我們持續不斷投入和完善的方向。
在數據源層面,我們自主設計了大數據平臺,盡可能地追求更廣的覆蓋面,包括公司財報、分析師預期數據、財務附注、日頻、分鐘頻等不同顆粒度的價量類數據。更多的數據來源,為我們尋找更多低相關的阿爾法提供了可能。
在因子庫層面,我們對海量的市場數據進行收集、篩選、處理和提煉,并在此基礎上形成了公司的特色因子庫。2011年以來,團隊自主研發因子超過2600個,因子儲備充足,且非常重視對因子細節的打磨,大多數具有比較良好的選股效果。
在模型的設計上,我們對機器學習模型的經典論文進行了深度研讀,在模型的設計上針對量化投資做了深度的定制和改進,對模型的各項特征進行了廣泛而深入的研究。目前選股模型儲備超20個,涵蓋多因子選股模型和AI選股模型,實際有效開發代碼超12萬行。
中國證券報:在模型設計上,廣發基金量化投資部有哪些迭代創新?
陳少平:經過近幾年的探索,廣發基金量化投資部從經典的多因子模型出發,逐步進化到多因子模型、量化基本面模型和機器學習模型并行的多元量化體系。多元量化體系的構建,既有助于應對不同風格的市場,也能為不同類型的產品提供更匹配的策略選擇。
目前團隊已經積累了多個不同的因子合成模型,既包括傳統線性模型,也有非線性的機器學習模型。在訓練過程中,機器學習模型傾向于給予價量類因子更高權重,而線性模型的因子權重則較為均衡,這導致不同模型在不同的市場環境下具備一定的差異。通過多模型的方式,能在一定程度上平滑波動,提高超額收益的穩定性。
中國證券報:團隊未來會在哪些方向進一步展開深入研究?
陳少平:未來團隊探索的一個方向是對機器學習及高頻因子做進一步的深度研究和探索。經過前期針對性的改造和適配,我們發現,引入機器學習模式及高頻因子,對于公募量化業績的提升有明顯的效果,后續也將繼續推進在量化平臺上對機器學習模型及高頻因子的深入設計。
另一個方向是對量化因子的持續挖掘和擴充,以及因子配置的不斷優化。量化因子庫是團隊投資和研究的基礎,根據市場情況不斷從新的數據源挖掘新因子,以及在現有數據基礎上改進和重構形成新因子,都是未來持續獲取超額收益的重要來源。另外,團隊將繼續研究從宏觀中觀維度、因子微觀維度以及AI賦能等多角度優化因子配權模型。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。