量化交易

业界观点

徐晓波

5-10年后，量化交易量或能占整个A股的50-70%

【2022-3-6】全国政协委员贺强：量化交易虽不违法，但对散户不公平，要加以监管

全国政协委员、中央财经大学证券期货研究所所长贺强：

（1）在发达国家、特别是美国股市中，个人投资占比不大，主要是机构投资、法人投资。机构与机构之间采用量化交易，是对等的、公平的。
- 量化交易在发达国家已经成为一种趋势，美国与欧洲的机构量化交易数值已达到70%左右。
（2）但我国股市以散户为主，散户在机构面前没有优势，量化交易大量从散户身上收割利益，这不太公平。对量化交易必须加以规范。
- 股民为主的市场，股市开户人数已达2亿户，99%以上可能都是散户。股民在股市中是弱势群体，信息不灵通，没有资金实力，更没有能力进行量化交易，在机构面前股民毫无优势。
- 光大证券量化交易事件，使我国投资者第一次感受到了量化交易的巨大影响。在2015年股灾中，公安部在上海查处了很多外资背景开立的贸易公司。这些公司大量进行股指期货量化交易，参与过度投机活动，导致了股指期货大涨大跌。投资者再一次对量化交易产生了深刻印象。
- 这两年，我国股票现货市场又出现了量化交易的热潮。量化交易像雨后春笋一样生长起来，规模不断扩大，几乎绝大多数机构都在进行量化交易。量化交易行业规模已经破万亿，在A股市场的成交占比达到了20%左右。

看法

从理论上讲，量化交易具有一些优点，可以增加市场的成交量、促进股市活跃、有利于形成合理价格，但是如果盲目发展，也会出现一些严重问题。
从性质上讲，量化交易短线操作获取的大量差价收益，就是从千千万万股民身上获得的利益，量化交易获利的主要方法是大量收割散户。以前机构是用镰刀割“韭菜”，现在是用智能化的机器人和联合收割机割“韭菜”。尤其要注意量化交易中的高频交易，主要是以博取短线差价为主，不是依靠长期投资分享上市公司业绩为主。
实际上，股市量化交易的问题已经引起了证监会的关注。证监会主席易会满在2021年第60届世界交易所联（WFE）会员大会暨年会上强调：量化交易、高频交易在增强市场流动性、提升定价效率的同时，也容易引发交易趋同、波动加剧、有违市场公平等问题。

在基金投顾业务开展过程中存在一些问题，基金投顾覆盖的投资者范围较小，投顾市场还存在“重投轻顾”的情况。如果独立基金销售机构参与基金投资顾问业务，恰好利于解决上述问题。

我国股市中的量化交易属于金融科技创新，要纳入监管范围，不能无序发展。特别是在股票现货市场，对量化交易必须进行一定的限制。

量化交易历史

时间	国内	国外
60年代		第一支量化基金成立
70-80年代		大奖章基金成立
90年代	股票市场开放	LCTM成立并破产
2000年初	第一支量化基金成立	全球量化基金规模突破1万亿美元
2016年	量化基金规模突破2千亿RMB	全球量化基金规模突破3万亿美元

国际发展历史

量化交易全球的发展历史

量化投资的产生(60年代)
- 1969年，爱德华·索普利用他发明的“科学股票市场系统”（实际上是一种股票权证定价模型），成立了第一个量化投资基金。索普也被称之为量化投资的鼻祖
量化投资的兴起(70~80年代)
- 1988年，詹姆斯·西蒙斯成立了大奖章基金，从事高频交易和多策略交易。基金成立20多年来收益率达到了年化70%左右，除去报酬后达到40%以上。西蒙斯也因此被称为”量化对冲之王”。
量化交易的繁荣(90年代)
- 1991年，彼得·穆勒发明了alpha系统策略等，开始用计算机+金融数据来设计模型，构建组合

国内发展历史

2012年到2016年量化对冲策略管理的资金规模增长了20倍，管理期货策略更是增长了30倍，增长的速度是所有策略中最快的。相比美国量化基金发展历程，中国现在基本处于美国90年代至21世纪之间的阶段。

量化投资元年
- 2010年，沪深300股指期货上市，此时的量化基金终于具备了可行的对冲工具，各种量化投资策略如alpha策略、股指期货套利策略才真正有了大展拳脚的空间，可以说2010年是中国量化投资元年。
量化投资高速发展、多元化发展
- 2013-2015年股指新政之前可以说是国内量化基金有史以来最风光的一段时期。国内量化投资机构成批涌现，国内量化投资高速发展。

2019年，梁文锋预测的国内量化路线图

什么是量化交易

【2022-10-12】如何学习量化交易
【2025-10-6】Alpha 因子与量化交易：入门黑话解释

定义

量化交易(Quantitative trading)

量化交易(量化投资)是指借助现代统计学和数学(机器学习)的方法，利用计算机技术来进行交易的证券投资方式。
量化交易从庞大的历史数据中海选能带来超额收益的多种“大概率”事件以制定策略，用数量模型验证及固化这些规律和策略，然后严格执行已固化的策略来指导投资，以求获得可以持续的、稳定且高于平均收益的超额回报。

量化交易 = 数据 + 程序 + 规则, 让电脑决定买卖，代替“我感觉这只股票不错就买”的方式。目的是：在市场上稳定地赚钱，而且不被情绪左右。

层/阶段	核心任务	如果这一层出问题，会怎样
找信号 / 选标的	从海量数据里挑出“有可能未来涨得多 / 跌得少”的标的	信号错了，再多钱也亏
组合 / 风控 / 仓位	怎么把几个信号组合起来，分散风险、控制回撤	同样方向太集中，一遇风暴就全盘崩
执行 / 下单	真正向市场下单，考虑手续费、滑点、冲击	理论上能赚钱，落地就亏光

比如，发现 A 股最近动量强（信号层），打算买。但不能一下买太多——股票流动性有限、别把本金压在一只上。更不能每次买就按“马上成交价”去成交——大单进去可能把价钱抬高（冲击）。所以在下单那步，还要“分批下单”“限价”“时间控制”等。

注意：“信号（signal）”，在量化交易里确实和“因子（factor）”非常接近，但两者有细微区别：

因子（Factor） → 是“可以解释或预测收益的变量”，通常比较稳定、长期。
信号（Signal） → 是“当下是否该买/卖的判断依据”，更即时、操作性强。

专业术语

信号/因子类

因子（Factor），预测变量/特征，就像给股票贴标签：这家公司是“便宜股”吗？是“强势股”吗？是“高质量公司”吗？每个标签就是一个因子。我们试图用这些标签预测未来谁能涨多一些。
价值（Value）股票好不好，看起来“便宜”的那个可能更有钱景。比方说：市盈率低、账面净资产/市值比高、现金流好等。例子：假设两家公司：A 和 B，利润差不多，但 A 市盈率 5 倍，B 是 50 倍。可能 A 被低估（价值因子喜欢它）。
动量（Momentum）最近涨得厉害的股票，可能还会涨一段。就像比赛里领跑者有惯性。但它不是保证，很多时候会拐头。例子：某只股票近 6 个月涨了 50%，动量策略可能判断它还有上涨空间。
质量（Quality）公司核心那块“肉”好不好。利润稳定吗？负债少吗？管理层靠谱吗？质量高的公司，即使市场风浪大，也能更抗跌。
低波 / 低β（Low Vol / Low Beta）不喜欢被大盘牵着鼻子走，也不爱“坐过山车”。这些股票平稳，不容易被市场情绪吓傻。 Beta 是衡量“跟大盘动得同步程度”的一个数：1 是大盘平均，低于 1 是弱相关。
Carry / 套利收益想象你借钱买股票，过程中还拿到股息/利息／利差，这里面“拿着就能赚”的部分就是 Carry。套利收益是“占便宜”的那口肉。
横截面 vs 时间序列
- 横截面：在一个时点，比较一堆股票谁更好，再买最好的。
- 时间序列：盯一个股票自己过去的走势，判断它之后怎么动。二者常常结合使用。
Alpha 超额收益，是你策略的“真章”。如果你跑得比大盘／基准好，这个差额就是你的 Alpha。
因子衰减（Alpha Decay）信号有效期渐短。曾经好用的因子，可能被市场“学坏”了，效果越来越差。类比：你发明一个秘籍好用，别人也学了、抄了，最后失效了。
拥挤（Crowding）很多人同时用同一个策略或因子，涌进去。最后大家抢一个池子里的蛋糕，收益被压缩。例子：所有人都在抄“低波 + 质量”组合，流动性有限的股票被压得很难操作。

策略派别类（门派）

统计套利 / Stat-Arb（Statistical Arbitrage）找两个或多个高度相关的标的，它们暂时“错位”了，就赌它们会回归到“正常关系”。配对交易（Pairs）就是经典例子：两只股票历史上常一起涨跌，某天“分手”了，就赌它们会再走在一起。
趋势跟随 / CTA（Commodity Trading Advisor / 趋势策略） “顺势而为”：市场涨，就追涨；市场跌，就放空或退出。跨市场（商品、债券、外汇）常见。趋势跟随不是每天都对，但长期能抓到大的波段。
市场中性（Market Neutral）多头 + 空头同时做，目标是“对冲掉”市场整体涨跌，只赚自己选得对的那部分。比方说：市场跌 10%，整体亏，但你的组合因为空头做得好，能抗住。
均值回归（Mean Reversion）假设价格会“回到平均水平”。若某支股票涨得太高，可能被做空；跌得太低，就可能买入。这种策略更适合震荡市，不太适合单边趋势很强的阶段。
做市 / 市场制造（Market Making）挂买价、挂卖价，中间赚差价。类似你在跳蚤市场说“我这个愿意买，我那个愿意卖”，赚买卖价差。但要管理仓位、控制风险，因为有时行情急变，库存就成炸弹。
高频交易（HFT, High-Frequency Trading）在微秒/毫秒级别做交易，靠极端速度抢价格、套利微小差价。是量化里最“尖刀”一派。因为频率极高、利润极薄，对技术、网络、延迟要求特别狠。

风险/组合/指标类

β（Beta）如果某支股票 β = 1.2，意味着大盘涨 10%，理论它涨 12%。如果跌 10%，它可能跌 12%。
- β > 1：比大盘更“疯狂”；
- β < 1：比较“稳健”。
暴露（Exposure）你暴露在哪些风险上：行业（科技、金融）、因子（动量、价值）、国家、风格。例子：你组合里科技股占 40%，那你对科技行业就有 40% 的暴露。
风险预算 / 风险平价 / 等风险贡献（Risk Budget / Risk Parity / ERC）假设整个投资组合你能接受 X 的风险（波动），你要把这 X 分给不同资产／策略，让每条腿“出力”均衡，不至于某条腿风一吹就倒。等风险贡献 (Equal Risk Contribution, ERC) 是一种方式，让每一条子策略或资产对总风险的“贡献”差不多。
相关性 / 协方差 两只资产的“联动程度”。如果高度相关（接近 1），它们涨跌方向经常一致，不分散。协方差更精细，是数量化版本。你选标的时希望它们不要全盘一致。
夏普比率（Sharpe Ratio）每承担一份风险（波动），能挣多少超额收益。高夏普：好；但过高可能在用过拟合欺骗自己。
回撤（Drawdown）从一个高点，一路跌到最低点，这段跌幅就是回撤。是你钱包被掏空的程度。例子：从 100 万跌到 70 万，中间无反弹，就是 30% 的回撤。

回测/验证/统计检验类

回测（Backtest）用过去的数据把策略“跑一遍”，看历史上它表现怎样。但要小心，这只是“假设历史就像未来”。
过拟合（Overfitting）把模型调得在历史上完美符合，可能只是在“记忆历史”而不是“理解市场”。现实里可能就崩。类比：考试时你背答案而不是理解题意，换卷子就错很多题。
多重检验 / 数据窥探（Multiple Testing / Data Snooping）你尝试成百上千个模型/变量，总有一个看起来“不错”。可那可能只是碰巧的一条，而不是真信号。
前视偏差（Look-ahead Bias / 数据前视）用了“未来才知道”的信息去做建模或回测，作弊了。例子：你用 2023 年才披露的财报数据去判断 2021 年买不买，是前视偏差。
幸存者偏差（Survivorship Bias）只用还活着的公司做回测，忽略破产、退市的那部分。让结果看起来比现实好很多。
走查 / 滚动验证（Walk-forward / Rolling Window）模拟“训练 → 验证 → 上线”的循环过程，避免一天拿全部历史算出来就上线。比如：用过去 5 年做模型，用接下来的 1 年检验，再把窗口滑动继续。
IC / RankIC
- IC（Information Coefficient）：预测值（信号）和实际未来收益的相关系数。IC 高，说明信号方向判断得对。
- RankIC：把所有股票先排序，信号排序和未来收益排序的相关性，更强调“谁在前谁在后”的判断能力。
信息比率（IR, Information Ratio）把信号的平均 IC / IC 的波动性算一个比率，高 IR 表示信号“稳定 + 有用”。

执行/成本/市场机制类

滑点（Slippage）你想在某个价格买入／卖出，但成交价比那高／低了。中间被市场“咬”走的部分就是滑点。
冲击 / 市场冲击（Market Impact）你自己下大单，可能把价格往不利方向推——你既是参与者，也是扰动者。
TCA（交易成本分析 / Transaction Cost Analysis）事后复盘：在一个策略中到底交了多少代价 —— 点差、滑点、冲击、手续费、拒单、换手率等。做 TCA 就像你跑完一场，回来算鞋子磨损、路上碰到坑多少次。
做市 / 市场制造（Market Making）保持买单和卖单挂在市场上，赚买卖价差。难点：库存风险（你买进去没人买），市场波动时可能被“吃掉”很惨。
流动性（Liquidity）一个标的你想进出容易吗？成交太少／差价太大，那就是流动性差。例子：小市值股票买卖一大单就涨个 2%、跌个 2%，成本高。
订单簿 / 摆盘 / Level 刻度订单簿是市场中所有买卖委托的深度数据：谁在多少价格愿意买/卖多少量。做高频 / 报价策略时，就要看这些“盘里有几个人愿意买卖”。
隐藏订单 / 冰山单 / 匿名挂单有时候你不想让整个市场看到你准备买多少，就把“隐藏量”放在“冰山单”里，只有部分量可见。

期权/波动/衍生类

波动率 (Volatility, Vol) 价格上下抖动的幅度。波动大，风险也大。年化波动率 20% 就意味着，在典型年份里，价格可能上下 ~20%。
VRP（Variance / Volatility Risk Premium）市场愿意为“保险（波动率）”付多少价钱，减去真实波动率，差价就是“溢价”。机构常用这个做波动率策略。
希腊字母（Greeks）：Delta, Gamma, Vega, Theta, Rho 等期权世界里，每个字母表示对某个变量（标的价格、波动率、时间等）的敏感度。例子：Delta 是“标的涨 1 坐我期权涨多少”；Theta 是“时间过去一天，我的期权价值掉多少”。

机器学习/信号建模类

特征工程（Feature Engineering）把原始数据（价格、成交量、财报指标、新闻）加工成 “模型能读懂的信号颗粒”。例子：把过去 20 天的涨跌平均、成交量标准差、新闻情绪指数做成一个特征。
三重障碍 (Triple-Barrier) 打标签给每个样本（股票＋起始时点）设置三个界限：涨到上界 → 给 “看涨标签”；跌到下界 → 给 “看跌标签”；时间到期还没突破 → “走平 / 中性”。这样你可以做分类任务。
元标签 (Meta-labeling) 不直接按一个信号下单，而在一信号基础之上，再套一个判断它值得下不值得下的模型。例子：先按动量信号建议买，然后再用新闻情绪／成交量等做二次判断，是不是“信心十足”的那笔才做。
分数阶差分 (Fractional Differentiation / Differentiation) 时间序列数据常有“长期趋势 + 短期噪音”。完全差分可能把趋势去掉，完全不差分又太非平稳。分数阶差分是折中的做法：保留一点趋势，也让数据更适合做模型。
强化学习/深度 RL（Reinforcement Learning）把下单、调仓当成一个“动作”，接收市场反馈（收益、风险），模型不断学怎么做最优动作。是比较前沿的一条。比如 FinRL 是一个开源框架，集成了 RL 在量化交易里的应用。

重点工作

量化团队里，哪里真的花最多精力 / 最容易出问题？

核心战场 1：因子 / 信号研究

这是量化交易最“烧脑”的地方，因为这里决定你是不是有料。

工作内容包括：

灵感 / 直觉来因子比如：为什么我觉得某些行业未来景气？我从新闻、政策、供需看到什么？把这些直觉变成数学表达式。
构造候选因子不只是“动量 + 价值”，还可能尝试“最近新闻热度 + 行业景气 + 资金流向”组合。每个组合都可能是一个因子。
因子测试 / 筛选用历史数据跑 IC / RankIC，看看信号有没有预测能力；对不同时间段、牛熊市、行业分组都做检验。
稳定性 / 漂移监控信号好的一期不代表下一期好。你要监控信号的稳定性、是否在某些环境里崩盘。例子：某因子在牛市阶段很好，在熊市阶段完全失效，那你用这个信号时就得加“环境判断”这层。
因子组合 / 权重确定把多个因子组合成一个“复合信号”或“得分机制”，并决定每个因子占多少权重，是线性加权？还是机器学习加权？
容量 & 拥挤度估算信号再好，也有“撑不起”的规模。有些因子只能拿几亿就顶了，你要估算最大可用资金。拥挤度高的因子，要设计退出 / 风险限额。

这是整个量化里最接近“研究 / 创意 /试错”的部分。

核心战场 2：回测 / 验证 / 抗过拟合

研究出信号之后，你不能立刻拿去实盘。你要告诉自己：这个信号是真的还是假的。你要做很多工，并且“骗子”很多。

关键工作包括：

设计严格的回测框架用 Purged K-Fold、Embargo、滚动窗口等方法，避免前视偏差和数据泄露。例子：训练集用 2010–2015 年，验证用 2016，测试用 2017–2018。不能在测试期“偷看”答案。
多重检验 / 控制“幸运因子” 对你测试的成百上千个因子，很多只是运气好才在历史上有效。有统计方法（如 White Reality Check、Deflated Sharpe Ratio、Hansen SPA 等）来检验：这个信号是不是在“随机模型中也可能出现”的。目标：拒绝“看起来很帅但其实不靠谱”的信号。
压力测试 / 极端场景模拟模拟大崩盘、流动性断裂、黑天鹅、交易卡顿等场景，看信号是否稳得住。
交易成本模型嵌入回测把点差、滑点、冲击、拒单率、费率、借券费都模型化，回测时扣掉这些成本。例子：你信号提示买 10 万股，若做成真实下单，可能要拆 10 次，每次滑点 + 冲击会侵蚀利润。
样本外验证信号在你没看过的“未来时间段/市场”里也要表现还行。不要只在历史里“练级”。

核心战场 3：执行 / 下单 / 真实落地

为什么很多策略看起来很好，实盘却亏？因为这一步容易翻车。

工作内容包括：

下单算法根据目标、市场流动性、实时盘口、冲击模型，决定是一次性下单、分批下单、挂单、限价单、滑点控制等。例子：用 Almgren-Chriss 模型来平衡冲击与风险，让你用不同速度下单以最优成本执行。
对冲 / 券商 /撮合机制适配跟券商沟通接口、撮合机制、撮合延迟、拒单率等。不同市场（A 股、港股、期货、外汇）接口机制不同，得适配。
实时监控 / 风控看已成交 / 未成交 / 挂单 / 拒单 /成交率 /滑点 / 资金占用 /保证金变化等。若发现跑偏、滑点爆表，就要自动退出或减仓。
TCA（交易成本分析）实盘后要细致拆解：我在这次交易里实际上付出了多少成本？是滑点大？是高速被吃？是拒单？是换手多？用这些反馈去调整下单节奏 / 策略参数。

技能

高频交易 vs 量化交易

【2022-10-21】高频交易与量化交易到底有什么区别？

高频策略对比低频策略有什么优势呢？Marcos Lopez的著名大作《Advances in Financial Machine Learning》第15章给出了数学推导。
高频交易几乎成为量化交易的代名词，主要原因可能不是它的效果比低频好，而是它能充分发挥计算机的算力优势，无论是训练过程还是执行交易过程，计算机在高频方面有天然的优势，人脑无法踏入这个领域。而如果是低频策略的话，人脑也能生成，未必需要用到计算机。

高频交易属于量化交易的一种，只是交易的频次非常高。

相同点都是利用数学、统计学、计量经济学等方法，从海量数据中寻找能够带来超额收益的”大概率”策略，并纪律严明地按照这些策略所构建的数量化模型来指导投资。

不同点

高频交易侧重于：

从极为短暂的市场变化中获利；
交易的交易量巨大，对计算处理速度、网速有着极高的要求，而且必须全自动化完成；
持仓时间很短，日内交易次数很多，每笔收益率很低，但是总体收益稳定；

量化交易（中低频）侧重：

通过海量数据挖掘，搜索可能产生超额收益的“大概率”事件来制定相应的投资策略；
通过资产估值来计算获利空间
通过投资组合和仓位管理来分散风险
可以自动化，也可以半自动化（即提供决策依据，交易由人工完成）

作者：觉行

量化交易分类

三种分类特点以及要求

（1）趋势性交易
- 适合一些主观交易的高手，用技术指标作为辅助工具在市场中如鱼得水的，但如果只用各种技术指标或指标组合作为核心算法构建模型，从未见过能长期盈利的。
- 一般也会做一些量化分析操作，使用编程如python/matlab 。
（2）市场中性
- 在任何市场环境下风险更低，收益稳定性更高，资金容量更大。适合一些量化交易者，发现市场中的alpha因子赚取额外收益，例如股票与股指期货的对冲策略等。
- 会做一些量化分析操作，使用编程如python/matlab。
（3）高频交易
- 在极短的时间内频繁买进卖出，完成多次大量的交易，此类交易方式对硬件系统以及市场环境的要求极高，所以只有在成熟市场中的专业机构才会得到应用
- 适合一些算法高手，使用C/C++编程语言，去进行算法交易，对软硬件条件要求比较高。
- 1、金融专业出生，对金融市场环境非深入了解（交易员、基金经理）
- 2、基本了解金融基础、投资知识，对数据挖掘、机器学习方法擅长，挖掘股票等的价值（quanter）
- 3、非常擅长算法，C/C++ ，编写程序化的一些交易方法（程序化交易员）

主动管理基本定律

IR 信息率: 衡量超额风险带来的超额收益
IC 信息系数: 预测值与实际结果值之间的相关性, 衡量投资经理选股能力高低
BR 广度: 同一时间做了多少个独立的投资决策

$ IR = IC * \sqrt{BR} $

概要

00:00 - 02:43 当AI来到华尔街：K线图，技术分析 -> 程序代码
02:43 - 05:19 基本面投资：拼信息差
05:19 - 08:31 量化投资：拼技术差
08:31 - 12:47 因子掘金：多因子投资和AQR资本
12:47 - 15:35 征服市场：统计套利与文艺复兴（西蒙斯的公司），“大奖章”基金年化收益率很高
- 统计套利三大工具: 技术分析、时间序列分析、机器学习模型
15:35 - 18:15 速度为王：毫秒之差的高频交易
- 通过大量数据、算法将交易快速自动化，拼速度
18:15 - 23:04 数据难题：华尔街最努力的实习生
23:04 - 25:23 工具即服务：AI Agent 一站式服务
25:23 - 27:25 寻找Alpha：利用AI建立投资策略
27:25 - 32:43 复杂性的价值：统计模型中的AI
32:43 - 35:33 华尔街征途：AI从实习生到决策者？

对冲基金四大派系

基本面投资
多因子投资
统计套利
高频交易

迭代趋势：

持仓少、定性、稳定、低频
持仓多、定量、不稳定、高频

派系	代表案例	特点
基本面投资	巴菲特	2016年，开始使用深度学习解决非结构化信息问题，打信息差
多因子投资	AQR
`统计套利`	文艺复兴
`高频交易`	Citadel

Alpha 因子

量化投资中不会直接说“我要赚 Alpha”，而是说“我要找到 Alpha 因子”。

金融世界里，Alpha 不只是一个数，而是一种信念—— 相信市场并非完全有效，总有人能在噪音中发现秩序(相信平凡的自己，能慧眼识珠眼光独到入木三分洞悉关键明察秋毫高屋建瓴运筹帷幄高瞻远瞩鉴往知来)。它既是科学（数据、统计、模型），也是艺术（直觉、洞察、理解人性）。

真正的 Alpha 因子，往往不是公式，而是对世界运行机制的深刻理解。

什么是 Alpha 因子

因子（Factor）指系统性解释资产收益差异的变量，比如：

估值类：市盈率（PE）、市净率（PB）
动量类：过去 12 个月收益率
成长类：营收增长率、利润增长率
质量类：ROE、毛利率、负债率
情绪类：散户关注度、新闻情绪分数

每个因子都被认为是潜在的 Alpha 来源：揭示可预测的、稳定存在的“市场规律”或“行为偏差”。

Alpha 因子构建流程

构建流程

定义假设（Hypothesis）比如：低估值股票未来可能跑赢高估值股票。
提取数据（Data Engineering）从财报、行情、舆情、新闻、公告、宏观变量中清洗出干净数据。
构建指标（Feature Engineering）用数学方式把想法量化成指标，比如 PE=股价/每股收益
测试有效性（Backtesting）在历史数据上检验该因子排序后的收益分布，评估其“选股能力”。
组合与中性化（Portfolio & Neutralization）为了区分“纯 Alpha”和市场波动，通常要对行业、规模、市值进行中性化。
动态更新（Rolling & Decay）因子有效性会随时间变化，需不断检验和更新。

Alpha 因子分类

Alpha 因子的常见分类

现代量化基金如 Citadel、Two Sigma、Renaissance Technologies 拥有成千上万个此类因子，每一个都像一条“神经元”，共同组成庞大的投资“大脑”。

量化投资因子分类表

类型	代表因子	核心逻辑
基本面因子	PE、PB、ROE、净利润率	反映企业价值和盈利能力
技术面因子	动量（Momentum）、均线偏离率	反映价格趋势和市场情绪
情绪类因子	新闻舆情、交易热度、微博指数	反映投资者行为偏差
宏观类因子	利率、通胀率、汇率、GDP增长	反映宏观环境
另类因子（Alternative Data）	卫星图像、夜间灯光、搜索指数	利用非传统数据挖掘隐含信号

Alpha 因子评估指标

衡量因子是否“真的有 Alpha”，主要看：

IC（Information Coefficient）因子与未来收益的相关系数，越高越好。一般 >0.05 就被认为是“有信息含量”。
IR（Information Ratio）衡量因子收益的稳定性（IC 的均值/标准差）。
回测收益曲线因子分组收益曲线是否持续上升。
Turnover（换手率）因子信号变化频繁程度，过高会导致交易成本过大。

Alpha 挑战与演化

Alpha 的稀缺化市场越成熟，有效的 Alpha 越少。机构越多，竞争越激烈。
Alpha 的衰减一旦被公开或广泛使用，因子会失效（被套利掉）。
从单因子到多因子模型如 Barra 模型、Fama-French 三因子模型，到今天的机器学习 Alpha 因子挖掘（AutoML、XGBoost、LSTM）。
从 Alpha 到 Smart Beta Alpha 因子被系统化后，演化为低成本的“因子投资指数”，如价值、动量、波动率策略。
从线性到非线性现代量化研究使用深度学习模型捕捉非线性关系，寻找“隐藏的 Alpha”。

投资策略

小市值策略

量化交易入门：小市值策略研究

小市值策略是一种投资策略，核心思想: 选择市值较小的公司进行投资。

小市值公司的股票价格相对较低，但是具有较高的成长性和投资价值。因此，选择小市值公司进行投资，可以获得更高的收益和回报。

小市值策略的理论模型主要包括两个方面：

公司基本面分析和市场行为分析。公司基本面分析是指对小市值公司的财务和业务进行分析，评估其成长性和投资价值。
市场行为分析则是指对市场供求关系、投资者情绪和预期等因素进行分析，预测市场走势和趋势。

小市值策略的理论模型步骤：

选择小市值公司：根据市值大小和其他基本面指标，筛选出市值较小、但具有较高成长性和投资价值的公司。
进行基本面分析：对选定的小市值公司进行财务和业务分析，评估其成长性和投资价值。
进行市场行为分析：对市场供求关系、投资者情绪和预期等因素进行分析，预测市场走势和趋势。
制定投资策略：根据基本面分析和市场行为分析的结果，制定适合自己的投资策略和组合。
风险控制和资金管理：注意风险控制和资金管理，选择适合自己的投资组合和策略。

主体逻辑

选出总市值介于20-30亿的股票
过滤ST、停牌、次新股
按升序排列取最小的三只股票
每日开盘买入
持有五个交易日调仓

聚宽平台上编写代码，见原文

小市值策略可以看作是一种因子投资策略，因为选择市值较小的公司进行投资，本质上就是选择了市值这一因子。同时，小市值策略也可以与其他因子进行组合，如价值因子、成长因子等，以获得更好的投资收益。

小市值策略和因子投资可以相互结合，形成多因子投资策略

业界实践

财经博主

【2026-5-31】嘿嘿我是静静啊: 辞职全职炒股，需要关注的五位财经博主，帮助自己实现了财务自由。

李一恩：擅长长线价值投资，前瞻性强，深耕硬核产业逻辑。
宇波罗：职业短线交易者，内容浅显易懂，分享散户经验教训。
天才阿蛮：适合股市新手入门，每日更新复盘，逻辑讲解清晰。
龙头大班长：实战能力强，有独门交易体系，复盘内容对新手友好。
孙宇晨：眼光长远，能提前看到行业发展趋势，擅长抓主线。

因子挖掘+信号研发

因子挖掘 + 信号研发：现实的“探宝”过程

选题 / 灵感阶段
- 团队开脑暴：政策、行业、宏观、资金流、新闻热点、公司基本面、供需变化等。
- 列几个“直觉题目”：我觉得新能源行业未来强，那有没有“新能源题材 + 盈利预测变化率”这个因子可做？
变量定义 / 特征构造
- 把直觉写成公式／变量：比如“未来三年净利润年复合增长率”；或“新闻热度指数”；或“机构增减持比率”等。
- 做平滑 / 加权 / 滞后 /排序 /中性化处理。
- 可能还做组合特征：这个变量 × 那个变量。
先验 / 基线验证
- 先用经典因子（价值、动量、质量等）做实验，确保你的数据管线（财报、价格、成交量）没问题。
- 把新加的那几个因子一起跑，看看是不是比基线好。
跑 IC / RankIC / 时间分段 / 行业分组 /环境分层
- 全市场跑 ICC；再分牛市 / 熊市 /高波动期 /低波动期，看信号稳定吗？
- 行业分组：在科技、金融、消费这些不同板块里表现一致吗？有偏好某些板块就要调整。
稳定性 / 漂移 / 因子解耦 / 敏感性分析
- 因子是不是被别的更强因子“吃掉”了（解耦分析）？
- 加一点扰动（如少量噪声、参数微调）看它还能通吗？
- 信号随时间漂移吗？之前强的地方，现在弱了吗？
合成 / 权重模型 / 决策层
- 多个因子组合：线性加权 / 主成分 /机器学习模型加权 /回归模型 /神经网络模型。
- 做中性化约束：行业中性、β中性、规模中性等。
- 做容量估算与资金分配：这个信号最多能拿多少资金。
嵌入交易成本 / 回测 / 抗过拟合 / 验证
- 在回测里加成本模型（点差 + 滑点 + 冲击 +手续费）
- 严格时间切分 / 多重检验 /样本外验证
- 压力测试 /极端场景下试运行
实盘小规模测试 + 调优
- 用少量资金上线跑，记录实盘表现 vs 纸面表现的差别
- 调整下单逻辑、滑点模型、执行节奏
- 再逐步放大规模
监控 / 熄火机制 / 再训练机制
- 信号 IC / IR /夏普 /回撤 /周转率等实时画图监控
- 若信号失温（IC 跌）、滑点爆表、风格暴露太强，就自动降权或暂停
- 每隔一定周期重训练 / 参数再估计 /漂移校正

机器学习炒股

【2019-1-4】利用深度学习和机器学习预测股票市场
- 英文
DL炒股算法

机器学习预测靠谱吗

深度学习做股票预测靠谱吗？
预测股市将如何变化历来是最困难的事情之一。这个预测行为中包含着如此之多的因素——包括物理或心理因素、理性或者不理性行为因素等等。所有这些因素结合在一起，使得股价波动剧烈，很难准确预测。
事实证明：
- 股票价格没有特定的趋势或季节性
- 股价受到公司新闻和其他因素的影响，如公司的非货币化或合并/分拆。还有一些无形的因素往往是无法事先预测的。

【2022-10-21】为何机器学习不被二级市场玩家重用？

金融市场本身的低信噪比 (signal-to-noise) 导致机器学习很容易出现过拟合。而这一特性导致投资管理人员很难有针对性地对投资组合进行调控。因此机器学习这一工具本身在选股场景下的应用场景还有待商榷。

机器学习优势

2019年，Keywan Christian Rasekhschaffe 和Robert C. Jones 两位作者就在CFA旗下期刊Financial Analyst Journal (FAJ)发表论文论述机器学习在选股方面的应用。

在机器学习本身的特性，使得其能够帮助挖掘传统线性回归等统计工具所难以发现的规律，例如非线性关系以及解决多重共线性方面具备无可比拟的优势。
论文原文链接: Machine Learning for Stock Selection

机器学习缺点

缺点也显而易见，金融市场本身数据噪音很大。这和传统机器学习擅长的数据场景有很大的不同。

以图像识别为例，一张照片到底是猫还是狗本身的争议性基本上很小很小。
但一个公司在某一阶段能否产生超额的资产回报这件事儿本身就见仁见智了，而且很可能存在市场内个别资产在某一时间内非理性的大涨大跌，而干扰整个数据集。

这也是为什么在金融市场应用中，常常见到的量化策略在样本内猛如虎，样本外哈士奇的原因。

更可怕的是，典型的机器学习算法，在面对如此低信噪比的数据时，很容易出现过拟合问题。

二位作者利用模拟数据测算，基本上在50次迭代 (iteration) 后，算法模型在样本外的误差不降反升，基本上只是在做过拟合的无用功。

模拟数据内，机器学习迭代次数和样本外误差的关系当然，两位作者同样提及了一些技术性的解决方案，例如

合并多个算法模型的结果，基于不同样本、风险因子库数据、时间窗口进行数据训练和预测，并采用合并结果等等。
特征工程(feature engineering)则是采用另一种思路，对数据进行处理变形以提升数据本身的信噪比。最终结果也非常惊艳，合并算法的选股收益高于任何单一算法的收益，在纸面上取得了每年接近2%的超额回报，Rank IC达到了惊人的6.5%。绝对是优秀的主动管理组合的水平。

用LR预测股票

【2022-3-29】如何使用机器学习在股票市场交易

股市最基本的策略是低买高卖。但这并不简单。所以，建立一个模型，尽可能准确地预测股票的低点和高点。
苹果股票从2018到2021的趋势, 绿点是局部极小值（低点），红点是局部极大值（高点）

用机器学习预测数据点是绿点（0类）还是红点（1类）。目标是如果模型预测到一个绿点，就买入，当股价上涨一定百分比时卖出。

四个步骤

（1）使用机器学习模型预测某一天买入股票是否有利可图。
（2）如果有利（绿点），买入股票。
（3）一旦股票上涨了一定的百分比，就卖出股票获利。（红点前）
（4）如果股票下跌了一定的百分比，就亏损出售股票。（红点后）

用股票价格和成交量作为LR模型的输入，并预测它是局部最小值还是局部最大值。

简单起见，创建一个0到1之间的值，表示所有四个值。该值由方程1计算得出。
- 如果标准化值接近1，这意味着该股票已接近当日高点收盘
- 如果标准化值接近0，则意味着该股票已接近当日低点收盘。
- 使用该值的优势在于与使用单一值（如当日收盘价或平均价）相比，它包含了全天价格行为的信息.

标准化股价

不直接使用股价，而是使用标准化股价作为第一个输入参数。
- 股票的价格包含最高价、最低价、开盘价和收盘价
成交量：模型中使用的第二个参数是每日成交量。表示特定日期的交易量。
3日回归系数：下一个参数是3日回归系数。通过对过去三天的收盘价进行线性回归计算得出的。代表了过去三天的股票走势。
5日回归系数：与3日回归系数类似的参数。
10日回归系数：同上。
20日回归系数：同上。

训练和验证模型定义模型之后，使用的数据集是道琼斯30指数的30家公司和标准普尔500指数的20家其他知名公司。

训练数据的时间跨度为2007年至2020年。
验证数据为2021年的数据。
首先要找到代表买入点（图1中的0类或绿点）或卖出点（1类）的数据点。这是通过算法来实现的，该算法用于搜索局部最小值和最大值点。选择数据点后，收集交易量数据，并计算标准化价格值和回归参数。
用python的scikit包将数据拆分为训练集和验证集，并训练LR模型。
验证结果和分析验证集包含507个数据样本。经过充分训练的LR模型能够预测验证数据，准确率为88.5%
选择高盛（Goldman Sachs）的股价数据，并使用经过训练的LR模型预测了每天的股票走势。
结果看起来很诱人，但模型预测了大量错误买入点。虽然它似乎能正确预测几乎所有的局部最小值，但它却错误地预测了买入点。因为训练阶段只使用局部极大值和局部极小值来训练模型。因此，模型对中间数据点的预测非常弱。
这是一个代价高昂的投资错误。毕竟，高买低卖不是我们的本意。那么如何解决这个问题，并更准确的选择买入点呢？
思路：分析混淆矩阵，通过改变LR模型的阈值来尝试减少这些误报，并确保模型以极高准确性预测买入点。为了确保模型更准确地预测买入点。
- 模型在类别0（买入点/局部最低）中预测了29个实例，而实际上它是类别1（卖点/局部最高）。这些都是假阳性值（错误地将阴性识别为阳性。阳性代表买入点）。
改进：模型的阈值更改为0.03，减少误报，并确保模型以极高准确性预测买入点
效果：错误预测的数量为零。然而，该模型忽略了许多真正的正值。模型只识别了5个买入点，没有识别出其它买入点。

	调整前（0.5）	调整后（0.03）
混淆矩阵

使用新阈值并重新绘制2021高盛股票的买入点

现在该模型可以更确定地预测购买机会。然而也错过了多次购买机会。这是必须做出的牺牲，以便以极高的确定性买入。

用2021个股票市场数据上测试策略。先创建一个股票模拟器和一个反向测试脚本

每天使用LR模型和给定阈值（t）扫描道琼斯30指数的买入机会。如果有可用的股票，模拟器就会购买股票并持有股票，直到达到一定的百分比收益（g）、一定的百分比损失（l）或在一定的天数（d）后卖出。
最终的回测模拟有四个参数: （t、g、l、d）
目标是利润最大化。

四种投资者类型。“没耐心的交易者”、“适度交易者”、“耐心摇摆交易者”和“非理性交易者”。

没耐心的交易者：这类交易者购买并持有股票的时间非常短。这类交易者害怕亏损，并且只为获得很小的收益。所以如果股价下跌一点点，此类交易者往往会以亏损卖出股票。所以，这类交易者的参数是: t=0.3，g=0.005，l=0.001和d=3。
适度交易者：这类交易者购买股票并持有一段适度的时间。交易者正在寻找信心较高的股票，因此阈值往往较低。与不耐烦的交易者相比，交易者也寻求更高收益，对损失有更高的容忍度。对于这类交易者，参数为 t=0.1、g=0.03、l=0.03和d=10。
耐心摇摆交易者：正如“摇摆”一词所暗示的那样，这类交易者往往持有股票的时间更长。此外，交易者喜欢选择成功概率高的股票。所以这类交易者的门槛很低。这类交易者的参数为: t=0.05、g=0.04、l=0.003和d=21。
非理性交易者：婴儿型交易者是对股票市场不熟悉的交易者。他们倾向于不合理地选择股票。因此，投资者不会使用任何策略来选择股票。这类投资者会随机挑选股票，并在任何时候随意抛售。

投资者类型	t(阈值)	g(百分比收益)	l(百分比损失)	d(卖出天数)	特点	2021年模拟收益率
没耐心	0.3	0.005	0.001	3	害怕亏损，短期持有，见好就收	30.41%
适度	0.1	0.03	0.03	10	容忍亏损，中期持有，寻求更高收益	26.95%
摇摆	0.05	0.04	0.003	21	长期持有，寻求成功率高的股票	47.77%
非理性					婴儿型，随机选择、抛售股票	13.72%

基于2021年的股票数据，每个投资者有3000美元作为他们的起始余额。

摇摆型交易者能够在2021年底获得47.77%的收益，其次是没耐心的交易者获得30.41%的收益。非理性交易者的回报率最低，涨幅为13.72%。
结果表明，在使用LR模型时，与频繁购买信心较低的股票相比，购买信心较高的股票并持有更长时间是有益的。我们也应该注意到，在2021美股股市是一个牛市，因为即使是非理性投资者，“猿类”，也有13.72%的回报率，这表明美股市场在2021年是慷慨的。
与标准普尔500指数的比较：前两个投资者模型（摇摆+没耐心）与标普2021年的业绩。
- 1月份向标准普尔500指数投资3000美元的表现。
结果表明，投资增长了26.9%。相比之下，“摇摆交易者”的回报率为47.77%，而“没耐心的交易者”的回报率为30.41%。

机器学习预测股票靠谱吗

观点：

文兄：日度的数据，用ML预测无卵用，加上盘口的高频数据ML倒是有可做的空间，但是还是无法满足DL对数据的质量要求。当然，如果是对策略进行优化，而不是纯以预测股价为目的，ML应该会有更多的应用空间。总之，DL现在做量化的应该是几乎不用的。
solo：如果说机构还能构建模型，对散户来说应该是通过归纳找出某周期内胜率大于50%的操作方式，合理设置盈亏比，严格执行之。并时时统计这个周期内胜率变化，一旦变化，相应策略也要调整。市场是混沌的，预测冇意义，一切都是概率变化而已
子皿：股市预测的问题本质上是一个online learning 的问题，因为股票市场上的规律是不断地在变的。这也是为什么传统机器学习方法和深度学习方法在金融市场上容易被当成笑话的原因。也因此，reinforcement learning 是显然不适合金融市场的，reinforcenment learning的反馈太慢了，所以需要大量的数据才能学到数据背后的规律。显然，在online learning场景下我们没有办法提供大量的数据。
Cerulean：深度强化学习靠不靠谱？
- 深度强化学习的本质还是监督学习，仅以离散动作空间为例，最大化多回合平均奖励函数的梯度和监督学习的最小化交叉熵的梯度公式是非常相似的，他们的唯一区别仅仅是前者乘以了一个根据具体问题正规化处理的奖励函数值。
张校长：深度学习来预测普遍存在的问题有两点。
- 数据缺失严重：数据当然是越精确越好， tick 级别的最好，最近几年tick 级的数据好找，应该也比较准确。但10 年之前 tick 级的数据就比较难找了，就算找到也不能保证这是准确的。导致能拿去训练的，只有08年 - 17 年这么多的数据。
- 过拟合：拿过去9年的数据做training ，最近1年做validation 。调参数，调出了一个比较好的参数。但要怎么保证这个参数在未来的几个月内依然表现良好？为什么有很多策略回测表现完美，但实盘就不行了？就是因为过拟合。
- 经济学到底能不能用数学来解释？
  - 许多人把深度学习作为万能法宝，但Andrew Ng 曾经说过，有些问题如果人解决不了，那机器也不行。
张大雄：中低频交易不可能，高频有空间

一家量化交易公司实习时，一次meeting，我和老总还有一个资深大佬谈机器学习在股票和期货里面的应用。

实习生	大佬	场景
LSTM在时间序列上应用的效果比较好，我们可以尝试把LSTM应用在股票预测上。	阴笑	大佬在阴笑，老总默不作声…
你为啥笑	不work啊！大佬终于忍不说有两个原因：第一个是你如何保证你的因子有效？	老总也在旁边强掩笑容老总就补充到：对啊，你的模型很可能garbage in garbage out.
那你们提供因子来训练模型啊	阴笑…. 第二个就是，你非常可能过拟合！
那我们可以加regularization啊		他们忽略我，老总接着说：其实我们是想要一个模型能根据每天的数据进行反馈，自动更新。
这TM的不就是reinforcement learning嘛，我说：可以用reinforcement learning试试。	大佬又开始笑了，我很纳闷大佬说：我就是知道他们有些人在用reinforcement learning，我才能赚钱！！！

最后实习结束之后，在大佬的带领下，我才明白了交易的三重境界

归纳
演绎
博弈

所谓深度学习不过是基于历史数据进行拟合的归纳法罢了

如果把深度学习用来做股票预测，长期的是expected亏钱的
因为市场在变，规律在变，历史可能重演，但是又不尽相同。

深度学习肯定是可以用在股票市场的，比如针对某只股票的新闻情感分析等。但是不能用来预测市场走向！！！

想在市场上赚钱，就得博弈，你得知道其他人在干什么，因为市场是有所有的参与者共同决定的。举个简单的博弈方法：
中国的期货市场之前很长一段时间，很多人，包括一些机构，都在用趋势策略，不同人和机构之间不外乎就是趋势的策略参数不同，让策略性能稍有不同，入市出市点不同，但是大体是类似的。
所以这时，你应该知道市场上有一部分资金是在用这种趋势策略在跑的，那么在未来的某一个时间点，这些策略会相继的发出信号，然后人们去执行买入卖出的操作。
有趣的地方来了，既然你已经知道有一部分人在干嘛了，你是不是就可以设计策略来巧妙的利用其他的人的策略呢？是不是可以设计一个类似的趋势策略，来告知你别人在这个时候可能会干嘛，而你来选择做更有意义的事情，而不是是不断去改进所谓的趋势策略呢？

所以，回到深度学习预测股票上：

用深度学习来归纳过去的数据，然后来预测股票走势，不靠谱。
但是如果能想办法把深度学习用在博弈问题上，那么有可能靠谱。更新：我在另一个回答里举了一个应用深度学习和博弈思想的例子，有兴趣的可以了解下。
MilKY：机器学习（非传统统计方法如回归）在量化金融方面有哪些应用？
参与交易的人，分为三类：
- 短期交易者
- 中期投机者
- 长期投资者。
大家喜欢说的价值投资就是长期投资者吧。这里的深度学习策略针对的是交易者和投机者。
尽管这里是深度学习在量化金融领域的应用，但是仍然是离不开人性和博弈的，深度学习在这里面更多的是一种工具性质的存在。

方法：

由于大部分散户的冲动和一部分基金从业者的新生力量需要时间磨练，市场上总是存在着因为走势而心情大变的人，心情一变，交易就受到影响，于是就犯错了，然后有老道者就可以抓住机会赚这一波钱。
一个简单情绪分析办法就是：拿到用爬虫爬取的这一天或这一周所有的新闻，以及你公司能够拿到的所有分析报告。然后分别用 LSTM模型对新闻和报告进行情绪分析。

为什么这么做呢？首先新闻太多，报告太多，个体交易员或者一般的基金公司根本不可能有时间来全部消化，那么只能用机器来解决，而深度学习中的 LSTM模型在自然语言处理领域的不错效果就可以被用在这里做情感分析了。然后用了LSTM之后能怎么样呢？

新闻：要时刻了解中国大妈们每天在看什么，可能会想什么，进而大概掌握大妈们未来的可能动向，从而设计相应的策略进行狙击。
报告：分析报告可能不是一般的散户能拿到的，所以拿到报告的大多数是机构，那么我们如果能用深度学习快速得到分析报告能带来信息，是不是可以抢人先机呢。

总结一下对博弈在交易里的理解。

核心思想：股市是零和博弈，无论你用不用深度学习，除了价值投资，你要赚钱，那么就得有人亏钱

所以说你的交易逻辑本身得是正确的才行，即设计好一个策略后，要知道你赚的钱是从哪来的。
- 很多人赚钱的时候稀里糊涂的，我们不妨称之为运气好。但是如果明白是运气好，并且不断探索原因的话，很有可能未来还会赚钱。
- 而事实是大多数人明明是运气好但是却觉得是自己聪明，从而未来大亏甚至倾家荡产。
如何应用深度学习呢，假设你已经明白了你得赚钱逻辑，但是这个逻辑里有些事情你一个人做不完，用计算机帮你做，用深度学习帮你做效率更好更快，那么深度学习不是就派上用场了。

深度学习不过是个复杂的函数映射逼近算法，你的逻辑就是函数，逻辑都不正确，逼近得再好又如何？

我自从2017年暑期在上海某私募基金实习之后，又在2017年圣诞节前后在湾区一家bitcoin fund实习了，然后自己私下做了一段时间交易，有一些新的理解分享给大家。

高频的东西不太懂，对于中低频而言，个人感觉，市场宏观分析，包括大国博弈，对世界进程有影响的大机构的发展，左右资源分配的局部战争，各个国家指定的政策，新兴事物的崛起等等，都会一定程度上影响到你关注的市场，这些才是决定市场走向的根本原因。
把握好大局之后，才是对具体标的的筛选，符合大趋势的标的，也有会做的好和做的不好区别，这个时候你可能要更进一步的阅读财报等更细节的信息。在筛选出标的之后，才是用技术分析对具体的某个标的的行情进行分析，选择对自己有利的入场点。

举个简单的例子

3/12/2020美股，币市等都因为COVID-19暴跌，虽然由疫情带来暴跌的黑天鹅事件很难预测，但是这暴跌之后，央行放水却是可以某种程度上预测的。那么这个时候需要选择在疫情中可能会崛起更快的标的（如Zoom，Amaozn）的股票，同时，高风险一点的，可以选择一些对抗央行放水的标的，比如BTC。

个人的PhD方向是做深度学习在医学影像领域的应用，目前深度学习的局限性还很大（连一个病灶分割的问题也没有办法彻底解决，而这对医生来说是很容易的事情）。虽然深度学习可以一定程度帮你分析问题，但是要依靠深度学习从市场中寻找规律预测涨跌，无异于大海捞针。

现在对大佬的话理解更深刻了，garbage in garbage out是常态，即便 gold in garbage out也是常态
毕竟给深度学习一张图，让它分割一下，都搞不定，你还指望它提取变幻万千的金融市场的特征？高频交易有可能，但我不了解，中低频，靠深度学习预测，你就是进来送钱的。

方法总结

预测方法	指标（RMSE）	备注
移动平均	104.5141	不理想
线性回归	121.1629	表现很差
k近邻	115.1708	与线性回归模型近似
自动ARMIA	44.9545	忽略了季节的影响
先知	57.4944	表现良好，但在本例中没有达到预期效果
LSTM	11.7722	轻松超越以上任何算法，但还不能确定未来涨跌

数据准备

Quandl为投资专业人士提供金融，经济和替代数据的首选平台，拥有海量的经济和金融数据。

拥有超过500个与金融相关的数据集，里面的数据包括港股数据、沪深股、加拿大股票
每个ip访问quandl有次数（50次）的限制，如果访问次数比较多的话，可以到官网注册一个账号。
除了Python之外，quandl也支持用excel、R等来获取数据。
更多参考：Quandl快速入门

import quandl # pip install quandl
# 获取数据集, Google股票数据
df = quandl.get('WIKI/GOOGL')
# 获得美国能源部的WTI原油价格：
mydata = quandl.get("EIA/PET_RWTC_D") # 默认pandas
mydata = quandl.get("EIA/PET_RWTC_D", returns="numpy") # 改变返回格式：numpy
# 还可以改变获取的时间区间啊，只选择特定的栏位
# 获取特定时间段的数据：
data = quandl.get("FRED/GDP", start_date="2001-12-31", end_date="2005-12-31")
# 获取特定列的数据：
data = quandl.get(["NSE/OIL.1", "WIKI/AAPL.4"])
# 获取特定行的数据：
data = quandl.get("WIKI/AAPL", rows=5) #后5行
# 改变采样频率：
data = quandl.get("EIA/PET_RWTC_D", collapse="monthly") #按月份
# 对数据进行基本的计算：
data = quandl.get("EIA/PET_RWTC_D")					#原始数据
data = quandl.get("EIA/PET_RWTC_D", transformation="diff") 	 	# 变化 
data = quandl.get("EIA/PET_RWTC_D", transformation="rdiff") 		# 百分比变化 	 
data = quandl.get("EIA/PET_RWTC_D", transformation="normalize") 	# 标准化为100 			
data = quandl.get("EIA/PET_RWTC_D", transformation="cumul") 		# 累计和
# 下载整个时间序列数据集
quandl.bulkdownload("ZEA")
# 调用整个数据表：数据表API限制每次调用10,000行，添加参数paginate=True则可以扩大到1,000,000行。
data = quandl.get_table('MER/F1', paginate=True)

NSE-TATAGLOBAL

数据集中有多个变量 —— 日期（date）、开盘价(open)、最高价(high)、最低价(low)、最后交易价(last)、收盘价(close)、总交易额(total_trade_quantity)和营业额(turnover)。
- 开盘价 和 收盘价 代表股票在某一天交易的起始价和最终价。
- 最高价、最低价和 最后交易价 表示当天股票的最高价、最低价和最后交易价格。
- 交易总量 是指当天买卖的股票数量，而营业额(Lacs)是指某一特定公司在某一特定日期的营业额。
注意：市场在周末和公共假期休市。
- 上表缺失了一些日期值——2/10/2018、6/10/2018、7/10/2018。其中2号是国庆节，6号和7号是周末。
损益的计算通常由股票当日的收盘价决定，因此将收盘价作为目标变量。

import pandas as pd
import numpy as np
 
#to plot within notebook
import matplotlib.pyplot as plt
%matplotlib inline
#setting figure size
from matplotlib.pylab import rcParams
rcParams['figure.figsize'] = 20,10
#for normalizing data
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler(feature_range=(0, 1))
#read the file
df = pd.read_csv('NSE-TATAGLOBAL(1).csv'
#print the head
df.head()
# 以收盘价为目标
df['Date'] = pd.to_datetime(df.Date,format='%Y-%m-%d')
df.index = df['Date']
#plot
plt.figure(figsize=(16,8))
plt.plot(df['Close'], label='Close Price history')

统计：移动平均

用一组先前观测值的平均值作为每天的预期收盘价。

使用移动平均法，而不是使用简单的平均值
移动平均法使用最近的一组数据计算预测值。对于后续的每个新的时间，在考虑预测值时，将从集合中删除最早的观测值，并加入上一个观测值。

data = df.sort_index(ascending=True, axis=0)
new_data = pd.DataFrame(index=range(0,len(df)),columns=['Date', 'Close'])
 
for i in range(0,len(data)):
     new_data['Date'][i] = data['Date'][i]
     new_data['Close'][i] = data['Close'][i]
# 数据分割为训练和验证时，不能使用随机分割，因为这会破坏时间顺序。所以将去年的数据作为验证集，将之前4年的数据作为训练集。
# splitting into train and validation
train = new_data[:987] # 训练集
valid = new_data[987:] # 验证集
new_data.shape, train.shape, valid.shape # ((1235, 2), (987, 2), (248, 2))
train['Date'].min(), train['Date'].max(), valid['Date'].min(), valid['Date'].max()
# (Timestamp('2013-10-08 00:00:00'),
# Timestamp('2017-10-06 00:00:00'),
# Timestamp('2017-10-09 00:00:00'),
# Timestamp('2018-10-08 00:00:00'))
# 为验证集创建预测值，并使用真实值来检查RMSE误差
# make predictions
preds = []
for i in range(0,248):
    a = train['Close'][len(train)-248+i:].sum() + sum(preds)
    b = a/248
    preds.append(b)

# ---------- 结果 ------------
#calculate rmse
rms=np.sqrt(np.mean(np.power((np.array(valid['Close'])-preds),2)))
rms # 104.51415465984348
# 仅仅检查RMSE并不能帮助我们评估模型预测效果的。
#plot
valid['Predictions'] = 0
valid['Predictions'] = preds
plt.plot(train['Close'])
plt.plot(valid[['Close', 'Predictions']])

推论：

RMSE值接近105，但是结果不是很理想(从图中可以看出)。预测值与训练集的观测值的范围相同(开始有上升趋势，然后缓慢下降)。

机器学习：线性回归

最基本的机器学习算法是线性回归。线性回归模型生成一个确定自变量和因变量之间关系的方程。

股票预测中，没有太多的自变量，只有日期。于是用时间（date）列提取特征，如- day, month, year, mon/fri等，然后拟合线性回归模型。

# 首先按升序对数据集进行排序，然后创建一个单独的数据集
# setting index as date values
df['Date'] = pd.to_datetime(df.Date,format='%Y-%m-%d')
df.index = df['Date']
# sorting
data = df.sort_index(ascending=True, axis=0
# creating a separate dataset
new_data = pd.DataFrame(index=range(0,len(df)),columns=['Date', 'Close'])

for i in range(0,len(data)):
    new_data['Date'][i] = data['Date'][i]
    new_data['Close'][i] = data['Close'][i]

#create features
from fastai.structured import  add_datepart # pip install fastai
add_datepart(new_data, 'Date')
new_data.drop('Elapsed', axis=1, inplace=True)  #elapsed will be the time stamp
# ‘Year’, ‘Month’, ‘Week’, ‘Day’, ‘Dayofweek’, ‘Dayofyear’, ‘Is_month_end’, ‘Is_month_start’, ‘Is_quarter_end’, ‘Is_quarter_start’,  ‘Is_year_end’, and  ‘Is_year_start’
# 创建星期特征（头、尾几天），如果是星期日或星期五，列值将为1，否则为0。
new_data['mon_fri'] = 0
for i in range(0,len(new_data)):
    if (new_data['Dayofweek'][i] == 0 or new_data['Dayofweek'][i] == 4):
        new_data['mon_fri'][i] = 1
    else:
        new_data['mon_fri'][i] = 0
# 数据集划分
#split into train and validation
train = new_data[:987]
valid = new_data[987:]

x_train = train.drop('Close', axis=1)
y_train = train['Close']
x_valid = valid.drop('Close', axis=1)
y_valid = valid['Close']

#implement linear regression
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(x_train,y_train)
# ------- 结果 --------
#make predictions and find the rmse
preds = model.predict(x_valid)
rms = np.sqrt(np.mean(np.power((np.array(y_valid)-np.array(preds)),2)))
rms # 121.16291596523156

#plot
valid['Predictions'] = 0
valid['Predictions'] = preds

valid.index = new_data[987:].index
train.index = new_data[:987].index

plt.plot(train['Close'])
plt.plot(valid[['Close', 'Predictions']])

推论：

RMSE值高于之前的方法，这清楚地表明线性回归的表现很差。
线性回归是一种简单的技术，很容易解释，但也有一些明显的缺点。使用回归算法的一个问题是，模型过度拟合了日期和月份。模型将考虑一个月前相同日期或一年前相同日期/月的值，而不是从预测的角度考虑以前的值。
从上图可以看出，2016年1月和2017年1月，股价出现下跌。该模型预测2018年1月也将如此。线性回归技术可以很好地解决像大卖场销售这样的问题，在这些问题中，独立的特征对于确定目标值是有用的。

机器学习：k-近邻

另一个有趣的ML算法是kNN (k近邻)。基于自变量，kNN可以发现新数据点与旧数据点之间的相似性。

from sklearn import neighbors
from sklearn.model_selection import GridSearchCV
from sklearn.preprocessing import MinMaxScaler

scaler = MinMaxScaler(feature_range=(0, 1))

#scaling data
x_train_scaled = scaler.fit_transform(x_train)
x_train = pd.DataFrame(x_train_scaled)
x_valid_scaled = scaler.fit_transform(x_valid)
x_valid = pd.DataFrame(x_valid_scaled)
 
#using gridsearch to find the best parameter
params = {'n_neighbors':[2,3,4,5,6,7,8,9]}
knn = neighbors.KNeighborsRegressor()
model = GridSearchCV(knn, params, cv=5)
 
#fit the model and make predictions
model.fit(x_train,y_train)
preds = model.predict(x_valid)
# --------- 结果 ---------
#rmse
rms=np.sqrt(np.mean(np.power((np.array(y_valid)-np.array(preds)),2)))
rms # 115.17086550026721

valid['Predictions'] = 0
valid['Predictions'] = preds
plt.plot(valid[['Close', 'Predictions']])
plt.plot(train['Close'])

推论：

RMSE值并没有太大的差异，但是一个预测值和实际值的曲线图应该提供一个更清晰的理解
RMSE值与线性回归模型近似，图中呈现出相同的模式。与线性回归一样，kNN也发现了2018年1月的下降，因为这是过去几年的模式。我们可以有把握地说，回归算法在这个数据集上表现得并不好。

时间序列：自动ARIMA

ARIMA是一种非常流行的时间序列预测统计方法。ARIMA模型使用过去的值来预测未来的值。ARIMA中有三个重要参数：

p (用来预测下一个值的过去值)
q (用来预测未来值的过去预测误差)
d (差分的顺序)

ARIMA的参数优化需要大量时间。因此我们将使用 自动ARIMA，自动选择误差最小的(p,q,d)最佳组合。

from pyramid.arima import auto_arima
 
data = df.sort_index(ascending=True, axis=0)
 
train = data[:987]
valid = data[987:]
 
training = train['Close']
validation = valid['Close']
 
model = auto_arima(training, start_p=1, start_q=1,max_p=3, max_q=3, m=12,start_P=0, seasonal=True,d=1, D=1, trace=True,error_action='ignore',suppress_warnings=True)
model.fit(training)
 
forecast = model.predict(n_periods=248)
forecast = pd.DataFrame(forecast,index = valid.index,columns=['Prediction'])
# --------- 结果 ----------
rms=np.sqrt(np.mean(np.power((np.array(valid['Close'])-np.array(forecast['Prediction'])),2)))
rms # 44.954584993246954
#plot
plt.plot(train['Close'])
plt.plot(valid['Close'])
plt.plot(forecast['Prediction'])

推论：

自动ARIMA模型使用过去的数据来理解时间序列中的模式。利用这些值，该模型捕捉到该系列中的增长趋势。虽然使用这种技术的预测比以前实现的机器学习模型的预测要好得多，但是这些预测仍然与实际值相距甚远。
该模型在序列中捕捉到了一种趋势，但忽略了季节的影响。

时间序列方法

【2022-4-20】时间序列预测方法汇总，包含理论及实践案例集合

时序问题都看成是回归问题，只是回归的方式（线性回归、树模型、深度学习等）有一定的区别。

（1）传统时序建模，如arma模型或者arima模型

arima模型是arma模型的升级版；arma模型只能针对平稳数据进行建模，而arima模型需要先对数据进行差分，差分平稳后在进行建模。这两个模型能处理的问题还是比较简单，究其原因主要是以下两点：
arma/arima模型归根到底还是简单的线性模型，能表征的问题复杂程度有限；
arma全名是自回归滑动平均模型，它只能支持对单变量历史数据的回归，处理不了多变量的情况。
总结：如果是处理单变量的预测问题，传统时序模型可以发挥较大的优势；但是如果问题或者变量过多，那么传统时序模型就显得力不从心了。

（2）机器学习模型方法，这类方法以lightgbm、xgboost为代表

这类方法一般就是把时序问题转换为监督学习，通过特征工程和机器学习方法去预测；这种模型可以解决绝大多数的复杂的时序预测模型。支持复杂的数据建模，支持多变量协同回归，支持非线性问题。
不过这种方法需要较为复杂的人工特征过程部分，特征工程需要一定的专业知识或者丰富的想象力。特征工程能力的高低往往决定了机器学习的上限，而机器学习方法只是尽可能的逼近这个上限。特征建立好之后，就可以直接套用树模型算法lightgbm/xgboost，这两个模型是十分常见的快速成模方法，除此之外，他们还有以下特点：
- 计算速度快，模型精度高；
- 缺失值不需要处理，比较方便；
- 支持category变量；
- 支持特征交叉。（3）深度学习模型方法，这类方法以LSTM/GRU、seq2seq、wavenet、1D-CNN、transformer为主
深度学习中的LSTM/GRU模型，就是专门为解决时间序列问题而设计的；但是CNN模型是本来解决图像问题的，但是经过演变和发展，也可以用来解决时间序列问题。总体来说，深度学习类模型主要有以下特点：
- 不能包括缺失值，必须要填充缺失值，否则会报错；
- 支持特征交叉，如二阶交叉，高阶交叉等；
- 需要embedding层处理category变量，可以直接学习到离散特征的语义变量，并表征其相对关系；
- 数据量小的时候，模型效果不如树方法；但是数据量巨大的时候，神经网络会有更好的表现；
- 神经网络模型支持在线训练。
实际上，基于实际预测问题，可以设计出各式各样的深度学习模型架构。假如我们预测的时序问题（如预测心跳频率），不仅仅只和统计类的数据有关，还和文本（如医师意见）以及图像（如心电图）等数据有关，我们就可以把MLP、CNN、bert等冗杂在一起，建立更强力的模型。

【2022-4-23】Google发布用于时间序列预测的可解释深度学习

深度神经网络(DNN)越来越多地用于多层面预测，与传统时间序列模型相比，表现出强大的性能改进。虽然许多模型（例如DeepAR、MQRNN）都专注于循环神经网络( RNN ) 的变体，但最近的改进，包括基于 Transformer 的模型，已经使用基于注意力的层来增强过去对相关时间步长的选择。 RNN 归纳偏置——信息的顺序有序处理，包括。然而，这些通常不考虑多层次预测中普遍存在的不同输入，或者假设所有外生输入未来已知或忽略重要的静态变量。
传统的时间序列模型受许多参数之间复杂的非线性相互作用控制，因此很难解释这些模型是如何得出预测的。不幸的是，解释 DNN 行为的常用方法有局限性。例如，事后方法（例如，LIME和SHAP）不考虑输入特征的顺序。提出了一些具有内在可解释性的基于注意力的模型对于顺序数据，主要是语言或语音，但多层面预测有许多不同类型的输入，而不仅仅是语言或语音。基于注意力的模型可以提供对相关时间步长的洞察，但它们无法区分给定时间步长不同特征的重要性。需要新方法来解决多层面预测中数据的异质性以实现高性能，并使这些预测具有可解释性。为此，Google宣布发表在International Journal of Forecasting 上的“用于可解释多水平时间序列预测的时间融合变换器”，Google在其中提出了时间融合变换器 (TFT)，一种基于注意力的 DNN 模型，用于多水平预测. TFT 旨在将模型与通用多水平预测任务明确对齐，以实现卓越的准确性和可解释性，Google在各种用例中展示了这一点。

时间序列：先知（Prophet）

有许多时间序列技术可以用在股票预测数据集上，但是大多数技术在拟合模型之前需要大量的数据预处理。

Prophet（先知）由 Facebook 设计和开发，是一个时间序列预测库，不需要数据预处理，并且非常容易实现。

先知的输入是一个带有两列的数据框: 日期和目标(ds和y)。

先知试图在过去的数据中捕捉季节性，并且在数据集很大的时候依然表现良好

from fbprophet import Prophet

#creating dataframe
new_data = pd.DataFrame(index=range(0,len(df)),columns=['Date', 'Close'])

for i in range(0,len(data)):
    new_data['Date'][i] = data['Date'][i]
    new_data['Close'][i] = data['Close'][i]

new_data['Date'] = pd.to_datetime(new_data.Date,format='%Y-%m-%d')
new_data.index = new_data['Date']
#preparing data
new_data.rename(columns={'Close': 'y', 'Date': 'ds'}, inplace=True)
#train and validation
train = new_data[:987]
valid = new_data[987:]
#fit the model
model = Prophet()
model.fit(train)
#predictions
close_prices = model.make_future_dataframe(periods=len(valid))
forecast = model.predict(close_prices)

#rmse
forecast_valid = forecast['yhat'][987:]
rms=np.sqrt(np.mean(np.power((np.array(valid['y'])-np.array(forecast_valid)),2)))
rms # 57.494461930575149
#plot
valid['Predictions'] = 0
valid['Predictions'] = forecast_valid.values
plt.plot(train['y'])
plt.plot(valid[['y', 'Predictions']])

推论

先知(像大多数时间序列预测技术一样)试图从过去的数据中捕捉趋势和季节性。该模型通常在时间序列数据集上表现良好，但在本例中没有达到预期效果。
事实证明，股票价格没有特定的趋势或季节性。价格的涨跌很大程度上取决于目前市场上的情况。因此，像ARIMA、SARIMA和Prophet这样的预测技术并不能很好地解决这个特殊的问题。

神经网络：长短期记忆网络(LSTM)

LSTM 算法广泛应用于序列预测问题中，并被证明是一种非常有效的方法。它们之所表现如此出色，是因为LSTM能够存储重要的既往信息，并忽略不重要的信息。

LSTM有三个门：

输入门：输入门将信息添加到细胞状
遗忘门：它移除模型不再需要的信
输出门：LSTM的输出门选择作为输出的信息

双向LSTM

encoder: 将字符转id，额外准备词表，oov单词统一设置为UNK；字符串 → id列表
embedding：一个单词一个向量（维数可定义），权重可修改，训练完毕后，相近单词词向量越近 —— 词向量副产物
rnn层：逐个元素迭代，时间步
dense层：全连接，对接回归（mse）、分类任务（logit）

Tensorflow实现：

# 序列结构
model = tf.keras.Sequential([
    encoder,
    tf.keras.layers.Embedding(
        input_dim=len(encoder.get_vocabulary()), # 设置词表
        output_dim=64, # 嵌入维度
        # Use masking to handle the variable sequence lengths
        mask_zero=True), # 用0来填充空白位置
    tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(64)), # 双向LSTM
    tf.keras.layers.Dense(64, activation='relu'), # 全连接层
    tf.keras.layers.Dense(1) # 目标值
])
# predict on a sample text without padding.
sample_text = ('The movie was cool. The animation and the graphics '
               'were out of this world. I would recommend this movie.')
# 不用padding
predictions = model.predict(np.array([sample_text]))
# 使用padding
padding = "the " * 2000
predictions = model.predict(np.array([sample_text, padding]))
print(predictions[0])

# Compile the Keras model to configure the training process:
model.compile(loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
              optimizer=tf.keras.optimizers.Adam(1e-4),
              metrics=['accuracy'])
# Train the model
history = model.fit(train_dataset, epochs=10,
                    validation_data=test_dataset,
                    validation_steps=30)
# 评估效果
test_loss, test_acc = model.evaluate(test_dataset)
print('Test Loss:', test_loss)
print('Test Accuracy:', test_acc)
# 绘图
plt.figure(figsize=(16, 8))
plt.subplot(1, 2, 1)
plot_graphs(history, 'accuracy')
plt.ylim(None, 1)
plt.subplot(1, 2, 2)
plot_graphs(history, 'loss')
plt.ylim(0, None)

两种类型的时间序列分析：

单变量时间序列：如，日期 → 销量
多元时间序列：如，日期、月份、星期、天气等 → 销量

from sklearn.preprocessing import MinMaxScaler
from keras.models import Sequential
from keras.layers import Dense, Dropout, LSTM
 
#creating dataframe
data = df.sort_index(ascending=True, axis=0)
new_data = pd.DataFrame(index=range(0,len(df)),columns=['Date', 'Close'])
for i in range(0,len(data)):
    new_data['Date'][i] = data['Date'][i]
    new_data['Close'][i] = data['Close'][i]
 
#setting index
new_data.index = new_data.Date
new_data.drop('Date', axis=1, inplace=True)
 
#creating train and test sets
dataset = new_data.values
 
train = dataset[0:987,:]
valid = dataset[987:,:]
 
#converting dataset into x_train and y_train
scaler = MinMaxScaler(feature_range=(0, 1))
scaled_data = scaler.fit_transform(dataset)
 
x_train, y_train = [], []
for i in range(60,len(train)):
    x_train.append(scaled_data[i-60:i,0])
    y_train.append(scaled_data[i,0])
x_train, y_train = np.array(x_train), np.array(y_train)
 
x_train = np.reshape(x_train, (x_train.shape[0],x_train.shape[1],1))
 
# create and fit the LSTM network
model = Sequential()
model.add(LSTM(units=50, return_sequences=True, input_shape=(x_train.shape[1],1)))
model.add(LSTM(units=50))
model.add(Dense(1))
 
model.compile(loss='mean_squared_error', optimizer='adam')
model.fit(x_train, y_train, epochs=1, batch_size=1, verbose=2)
 
#predicting 246 values, using past 60 from the train data
inputs = new_data[len(new_data) - len(valid) - 60:].values
inputs = inputs.reshape(-1,1)
inputs  = scaler.transform(inputs)
 
X_test = []
for i in range(60,inputs.shape[0]):
    X_test.append(inputs[i-60:i,0])
X_test = np.array(X_test)
 
X_test = np.reshape(X_test, (X_test.shape[0],X_test.shape[1],1))
closing_price = model.predict(X_test)
closing_price = scaler.inverse_transform(closing_price)
# ------------- 结果 -----------
rms=np.sqrt(np.mean(np.power((valid-closing_price),2)))
rms # 11.772259608962642
#for plotting
train = new_data[:987]
valid = new_data[987:]
valid['Predictions'] = closing_price
plt.plot(train['Close'])
plt.plot(valid[['Close','Predictions']])

推论：

LSTM轻松地超越了目前看到的任何算法。
LSTM模型可以对各种参数进行调优，如改变LSTM层数、增加dropout值或增加训练迭代轮数（epoch）数。
但LSTM的预测是否足以确定股票价格将上涨还是下跌? 当然不行！
股价受到公司新闻和其他因素的影响，如公司的非货币化或合并/分拆。还有一些无形的因素往往是无法事先预测的。

神经网络：STHAN-SR

量化交易和投资决策是复杂的金融任务，依赖于准确的股票选择。目前深度学习学习的策略使用于股票的问题的方案面临两个重大局限。

不直接优化利润方面的投资目标；
将每只股票视为独立于其他股票，忽略了相关股票之间的丰富信号股票价格变动。本文基于该局限性，将股票预测重新表述为一个学习排序问题，并提出了STHAN-SR，一种用于股票选择的神经超图结构，从而定制一种新的时空注意超图网络结构，通过联合建模股票相互依赖性及其价格的时间演变，根据利润对股票进行排序。

在三个市场上进行为期六年的实验，发现STHAN-SR显著优于最先进的神经股票预测方法。通过对STHAN-SR的空间和时间组件进行烧蚀和探索性分析来验证我们的设计选择，并证明其实用性。

TimesNet

【2024-8-18】短时序预测排名第一的网络模型

【2023-4-12】清华 TIMESNET: TEMPORAL 2D-VARIATION MODELING FOR GENERAL TIME SERIES ANALYSIS
代码 TimesNet, 模型定义 models/TimesNet.py

截止2024.3, 时间序列在不同类型数据集合排名

TimesNet: 短周期序列的预测上排名第一, 核心是捕捉时序中的多周期关系

TimesNet根据时间序列的多周期性，它的模块化架构能够捕捉来自不同周期的时间模式。对于每个周期，为了捕捉相应的周期内和周期间的变化，我们在TimesNet中设计了一个TimesBlock，它可以将一维时间序列转换为二维空间，并通过一个参数高效的inception模块同时对这两种变化进行建模。

核心思想

用模块化方法进行时间变化建模。通过将一维时间序列转换为二维空间，这样可以同时呈现周期内和周期间的变。这样我们便可以挖掘多重周期性以及周期内和周期间复杂交互。
TimesNet使用TimesBlock通过一个参数高效的Inception模块来发现多个周期，并从转换后的二维张量中捕捉时间上的二维变化。

大模型与量化

量化交易机器人

量化框架

2026年量化框架终极对决：QLib、QuantConnect、Zipline

QLib、QuantConnect、Zipline，这三大量化框架到底该怎么选？

有人靠QLib的AI模型赚得盆满钵满，有人却吐槽它实盘对接难到崩溃；
有人用QuantConnect轻松打通全资产交易，有人却嫌它回测速度跟不上节奏；
还有人坚守Zipline的经典玩法，有人却直言它早已跟不上2026年的量化潮流

结合GitHub最新数据（2026年2月），三大框架的关键资质一目了然：

QLib：AI量化的“天花板”，研究回测的一把好手
- 微软开源的AI量化投资平台，完全免费，GitHub星标达26K+，支持多种机器学习模型，主打AI集成与高效回测，是机构研究的首选工具之一，无需付费即可使用全部核心功能，适合有一定技术基础的研究者和机构用户。
QuantConnect：全场景适配王者，实盘落地的首选
- 核心引擎Lean开源免费，GitHub星标1.57W+，支持Python和C#双语言，可免费使用基础回测和实盘对接功能，高阶云端计算资源需付费（国内适配版基础套餐约300元/月，高阶套餐约800元/月），新手和机构都能灵活适配。
Zipline：经典框架的坚守者，新手入门的过渡之选
- Pythonic算法交易库，开源免费，GitHub星标1.26W+，是事件驱动型框架的经典代表，无需付费即可使用全部基础功能，但社区更新频率较低，高阶功能需自行二次开发，更适合偏爱经典交易逻辑的开发者。

没有完美的量化框架，只有最适配自己需求的框架。

QLib的强大毋庸置疑，AI集成和回测速度，确实能大幅提升机构的研究效率，让复杂的因子工程和AI策略落地变得更简单。但我们不能忽视它的短板——实盘对接难、多资产支持不足，如果你是新手，或者需要快速实盘落地，盲目选择QLib，只会陷入“研究得再好，也无法落地盈利”的困境；可如果你是机构研究者，核心需求是策略研究和回测，不需要快速实盘，那QLib绝对是最优解，甚至能帮你在众多机构中抢占研究先机。
QuantConnect 全场景适配，让它成为很多人的“首选框架”，尤其是对于需要实盘落地、覆盖多资产的用户来说，它的优势几乎不可替代。但它的回测速度和AI能力，确实不如QLib，如果你是高频策略研究者，需要处理大规模数据、运行复杂AI模型，那QuantConnect的效率可能无法满足你的需求；可如果你是新手，或者是需要兼顾研究与实盘的机构，它的易用性和落地能力，能帮你少走很多弯路，甚至快速实现盈利。
Zipline 虽然看似“落后”，但它的价值依然不可忽视。对于刚入门的量化新手来说，复杂的框架只会让人望而却步，而Zipline的简洁易用，能让新手快速熟悉交易逻辑、掌握策略编写技巧，为后续学习更复杂的框架打下基础。但如果你已经有一定技术基础，或者需要做AI策略、实盘交易，再坚守Zipline，只会限制自己的发展，甚至错过更好的盈利机会——毕竟，量化交易的核心是效率和落地，跟不上潮流，就会被淘汰。

总结

【2024-7-26】哥伦比亚大学 Large Language Model Agent in Financial Trading: A Survey,对利用大型语言模型作为金融交易Agent进行了首次系统调研，总结了两种主要架构设计、四类关键数据类型以及评估方法，并讨论了当前局限性与未来方向。

从 27 篇用LLM做量化交易的论文中总结出来, 其中 7篇文章标题里包含 Agent

Google Scholar 搜索词: LLM for trading, GPT stock agent

Agent 架构分两种

(1) LLM as a Trader: 直接生成交易策略, 买入/持有/卖出
- news-driven: 最基础类型, 将股票新闻和宏观经济更新信息集成到Prompt中, LLM预测股票下一周期预测趋势, 案例: LLMFactor, MarketSenseAI
- reflection-driven: FinAgent, FinMem
- debate-driven: TradingGPT, HAD
- reinforcement learning(RL)-driven: SEP
(2) LLM as an Alpha Miner: 生成高质量alpha因子,用于下游交易系统
- AlphaGPT:
- QuantAgent:

详见原文

观点

【2024-6-26】“量化四大天王”之一的锐天投资创始人、CEO徐晓波

2013年，徐晓波在上海创立锐天投资，最早从股指期货高频起家，2016年进军资产管理的新赛道，开始建立股票中高频的策略团队。
目前，锐天投资旗下既有股票的高频、中频、低频，也有CTA和可转债的策略。

5-10年后，量化交易量或能占整个A股的50-70%

GPT在量化暂还没有广泛应用

以前大家对AI（含GPT）的认知是一个统计模型

非线性的统计模型，跟一个纯线性的统计模型并没有质的变化

GPT 是一个非常颠覆式的科技突破和创新

不只停留在模型的网络架构，或者是其中一些环节、流程的创新，而是在于范式和思想创新

GPT 语言理解能力，比以前越来越强。

理解能力的增强，一方面来源于参数本身的扩大，同时也来源于语料库的丰富。
GPT甚至开始在数学领域证明数学定理——能做一些非常复杂的推理的工作，以前不具备

GPT跟量化的可能性。

单纯用一个语言模型来解决量化问题，并不好；
量化多以数字形式存在，常用机器学习方法预测收益率，语言模型不适合
- 但用语言模型去更好地理解多种形态的数据（新闻、研报）值得探索
GPT去更好地挖掘一些市场规律？短期内，有待考证

(1) Trader

GPT-4o

【2024-9-7】30 天 52% 回报：GPT-4o 量化交易机器人

原文 52% Returns in 30 Days: Your GPT-4o Quant Trading Bot Strategy

ChatGPT 交易策略

用 ChatGPT 创建交易策略。文章：

一个月内创造了 52% 回报。然而，交易中没有100%确定的事情，过去的结果可能与未来的回报并不一致。

TradingView 测试AI交易策略。

步骤 1 - 选择资产
- 对于均值回归等量化交易策略来说，横盘交易的资产往往能产生更好的效果。
- 选择以太坊，因为已经横盘数月。验证能否创建一个在市场横盘甚至下跌时获利的交易机器人。
步骤 2 - 用图表提示 GPT-4o
- 简单提示比冗长复杂提示更有效，提示必须简洁明了。在本例中，结合图表对AI进行了如下提示：
  - 为图表中的资产创建可盈利的均值回归 Pine 5 量化策略。
  - Create a profitable mean regression Pine 5 quant strategy for the asset in the chart.
- GPT-4o: 策略包括使用布林带和 RSI
步骤 3 - 将 Pinescript 代码复制/粘贴至 TradingView
- 转到 TradingView 的 Pine Editor 并粘贴代码，然后将其添加到图表中。
- 现在，该策略应该可以在图表上和策略测试选项卡中进行回测。
步骤 4 - 微调量化策略
- 除了要对策略进行上百次测试以外，还必须手动优化策略。
- 在不同的时间框架和不同参数下测试策略，尝试不同的值，看看哪个值能产生最好的结果。将策略应用于实际资金之前，对其进行广泛测试至关重要
出色的回报（回溯测试）
- 回测中，GPT-4o 创建的策略产生了非常令人印象深刻的结果
- 1 个月的时间里，该策略在交易以太坊（ETH/USD）时创造了 52% 的惊人回报。

预测股票回报

【2024-11-26】瑞士日内瓦 RAM Active Investments的Systematic Equities Team。如何对大型语言模型（LLMs）进行微调，用财经新闻流来预测股票回报。

股票回报预测对于量化投资任务，如投资组合构建和优化，是基础且重要的。
论文 Fine-Tuning Large Language Models for Stock Return Prediction Using Newsflow
解读: LLM做量化

问题建模

投资宇宙：假设由一组股票 U=s1,s2,...,ss 组成的投资宇宙，其中 si 代表股票索引。在量化投资中，股票选择过程基于定量标准从宇宙中选择一个子集作为投资组合。
股票选择过程：随着市场条件和各种信息的变化，股票选择过程会定期（例如，每周、每月等）重复执行，以更新或重新平衡投资组合。
LLMs基础回报预测模型：模型包括文本表示模块和预测模块。
- 目标: 通过联合微调预训练的LLM g 和训练一个密集层 f 来实现方程 $ \hat{r}{s,t+\ell} = f \circ g(X{s,<t}) $ ，其中 $X_{s,<t}$ 是在回顾时间窗口 $ W $ 内可用的新闻文本。

仅编码器 LLM DeBERTa 和两种仅解码器 LLMs，Mistral-7B和Llama3-8B基础模型，并使用均方误差（MSE）作为损失函数

从LLMs的文本表示中派生的回报预测是构建投资组合的强信号，表现优于传统情感分数

大模型实时炒股比赛

【2025-10-21】谁家AI用一万美元赚翻了？DeepSeek第一，GPT-5垫底

初创公司Nof1发起的“Alpha Arena”基准测试，并非模拟交易。

nof1.ai

主办方为了衡量AI投资能力，给每个模型账户发放一万美元启动资金，在真实市场自主交易数字货币。

Alpha Arena 直播整个过程，价格会实时波动，并对实时收益进行排名，还可以看到每个模型的交易思路。

按目前盈利能力排名，参与这次比赛：DeepSeek chat v3.1、Claude Sonnet 4.5、Grok 4、Qwen3 Max、Gemini 2.5 pro、GPT 5六个AI模型，有三家海外头部模型和国内两家模型。

这一投资交易竞赛开始于美东时间10月18日，持续两周，于11月3日结束。

真实市场交易有趣的地方在于，市场永远有波动，是不可预测，即便最先进的AI也无法保持稳定的收益。正如官方所说的那样，“市场是智力的终极考验”。

前三天，排名第一 DeepSeek 收益率还一度接近40%，盈利超过4000美元
但10月21日随着大盘下跌，也回吐了部分收益，DeepSeek收益率稳定在10%左右，不过仍然是第一。

(2) 【2024-9-15】Alpha Miner

【2024-9-15】基于大模型的量化交易股票投资框架，实现自动化策略发现

Automate Strategy Finding with LLM in Quant investnent 用大型语言模型（LLMs）和多智能体架构，提出了一个新的量化股票投资框架，通过LLMs挖掘alpha因子并使用多智能体动态评估市场条件

【2024-10-16】TradExpert

【2024-10-16】TradExpert：一种基于大型模型的股票交易新方法，实现了高达 49.79% 年回报率

论文地址：TradExpert: Revolutionizing Trading with Mixture of Expert LLMs

TradeExpert 创新框架采用混合专家（MoE）系统，整合了四个专门设计的语言模型（LLM），用于解析各类金融信息来源，包括新闻报道、市场动态、阿尔法因子以及公司基本面数据。

(1) 市场分析
- 市场分析LLM致力于解析历史OHLCV数据以预测股票趋势，然而时间序列数据与LLM的离散结构之间的不兼容性带来了应用上的挑战。为此，采用了重编程机制，将OHLCV数据转换为文本原型表示。具体来说，OHLCV数据实例X(i)被分割并嵌入为补丁嵌入XP，然后利用文本原型E’进行重编程处理。通过多头交叉注意力机制生成重编程后的补丁嵌入O(i)，并将其映射到LLM的隐藏层维度。最终，这些重编程嵌入与通过TSFresh提取的统计特征相结合，作为Alpha Expert模型的输入提示。
(2) Alpha分析
- Alpha Expert专注于处理基于表达式的alpha因子，这些因子是用于预测股票价格变动的技术指标和通过算法生成的特征。借助GPT-4来解析复杂的表达式，为每个因子生成详细的语言描述，从而构建Alpha数据库。每个alpha记录包括两部分：表达式（即基于OHLCV数据的计算公式）和描述（由GPT-4生成的解释）。在计算所有alpha因子的值之后，使用LightGBM模型进行综合评分，从中挑选出对评分影响最大的Top-K个alpha因子。随后，从数据库中检索这Top-K个alpha因子的描述，并连同它们的计算值一起，作为Alpha Expert模型的提示和指令输入。
(3) 基本面分析
- 基本面分析师LLM专注于解析财报电话会议记录和财务指标，以预测季度股票价格的变动。其预测流程与新闻分析师LLM类似，但由于基本数据每季度更新一次，因此预测重点放在下一个季度的表现。预测结果分为五个类别：“强上涨”、“中等上涨”、“无变化”、“中等下跌”或“强下跌”，并附有详细的理由说明。提供的总结报告旨在评估股票在未来一段时间内的涨跌趋势。对于两个股票的总结报告，该模型还需判断哪个股票在未来几天内的表现更为优异。
(4) 通用专家
- 通用专家LLM具备两种操作模式：预测模式和排名模式。在预测模式下，该模型用于预估股票的走势，输出股票上涨或下跌的二元预测。而在排名模式中，它通过比较两只股票的表现来决定它们的相对排名。为了确定Top-K排名，采用了一种放宽的比较排序算法（类似于冒泡排序），尽管这种算法的时间复杂度为O(N²)，但更多的比较可以提升排序的准确性。通用专家LLM同时在股票走势预测和比较任务上进行了微调训练。

这些专业LLM分析结果被中央LLM汇总，从而生成最终的预测或决策建议。

TradeExpert 具备切换预测与排名两种模式的能力，适用于股票趋势预测和量化投资策略。

此外，还发布大型金融数据集，用以测试TradeExpert的性能。

实验表明，无论在哪种交易情境下，TradeExpert均展现出色的表现。

【2024-12-28】TradingAgents

TradingAgents: 基于Multi-Agent的金融交易框架

加州洛杉矶分校和MIT Yijia Xiao、Edward Sun、Di Luo 和 Wei Wang 发表于 AAAI’2025

国外团队 TauricResearch 发布 TradingAgents

【2024-12-28】论文 “TradingAgents: Multi-Agents LLM Financial Trading Framework”
项目主页 TradingAgents: Multi-Agents LLM Financial Trading Framework
GitHub TradingAgents
国内有人推出汉化版，并开源，【2026-1-12】TradingAgents-CN 基于多智能体LLM的中文金融交易框架 - TradingAgents中文增强版

提出创新框架，利用多智能体系统模拟真实交易公司的协作决策过程，通过增强数据分析和决策能力提升交易表现。

动机

传统算法交易系统依赖量化模型，难以对复杂的市场影响因素，如基本面、市场情绪、技术指标和宏观经济事件等之间的复杂交互关系进行建模。

相比之下，LLMs 擅长处理自然语言数据，特别适合分析新闻、财务报告和社交媒体情绪，这对市场分析至关重要。

然而，现有金融领域 LLM 应用面临两大挑战：

缺乏现实组织建模：许多框架没有考虑模拟现实交易公司结构的Agent间的复杂互动，而是专注于特定任务表现，脱离了实际组织工作流程。
- 例如，Li 等（2023a）、Wang 等（2024b）和 Yu 等（2024）的研究指出，这种局限性限制了框架复制真实交易实践的能力。
通信效率低：大多数系统使用自然语言作为主要通信媒介，依赖消息历史或非结构化信息池，易导致“电话效应”(telephone effect)，即细节信息在长对话中丢失，状态被破坏。
- Agent在处理复杂动态任务时, 难以维持上下文和过滤无关信息，影响决策有效性。

TradingAgents 通过模拟交易公司的多智能体决策过程，解决这些问题。其设计灵感来源于真实交易公司的组织结构，强调协作和结构化通信。

Agent 分工与协作

TrandingAgents 将 Agent 分为多个团队:

分析师团队：包括基本面分析师、情绪分析师、新闻分析师和技术分析师，负责收集和分析市场数据，提供全面市场视图。
- 例如，基本面分析师评估公司财务报表，情绪分析师处理社交媒体数据，技术分析师预测价格走势。
研究团队：由看多和看空研究者组成，通过辩论评估投资潜力与风险。
- 看多研究者关注增长机会，构造支持投资的论点；
- 看空研究者则关注潜在下行风险，提供警示性见解。
交易员：评估分析师和研究者的分析和辩论报告，决定交易时机和规模，执行买卖订单，以及基于市场反馈调整投资组合。
风险管理团队：基于交易员的决策结果和相关报告，从风险约束的视角调整交易计划。
- 内部在一个协调员的组织下进行 n 轮讨论，得到讨论结果。
基金经理：审核风险管理团队的讨论结果，调整风险策略，并更新交易员的决策结果和报告状态。

通信与协作

为了提高效率，TradingAgents 采用混合通信方式：

自然语言对话：智能体通过对话分享见解、辩论观点，探索复杂想法。
结构化输出：对于需要精确数据的任务，智能体生成可解析的结构化输出，如结构化的分析报告或辩论报告，确保每个Agent都可以准确获取与自身任务相关的信息，建立可靠的决策依据。

LLM 选择

基于任务场景和模型特长来针对性选择 LLM。

对于涉及文本总结、信息获取和数据转换的场景，采用非推理模型，如 gpt-4o-mini 和 gpt-4o
对于数据分析、辩论、交易决策等场景，采用更慢但准确性更高的推理模型，如 o1-preview。

所有的 Agent 均采用 ReAct 提示词框架，同时共享全局的环境状态，用于消息交换。

基准模型包括:

买入并持有（Buy and Hold）
- 在整个投资周期内，将资金平均分配到选定的股票中并长期持有，不进行频繁买卖。
MACD动量策略（MACD: Momentum strategy based on MACD crossovers）
- 基于MACD（异同移动平均线）指标的金叉（买入信号）和死叉（卖出信号）进行趋势交易的动量策略。
KDJ与RSI双指标策略（KDJ & RSI: Combined momentum indicators for trading signals）
- 同时结合KDJ（随机指标）和RSI（相对强弱指数）的超买/超卖信号，通过两者共振产生交易决策。
均值回归策略（ZMR: Mean reversion strategy based on price deviations）
- 当资产价格偏离其长期均值时（如Z-Score模型），押注价格会回归均值，通过反向操作获利。
移动平均线趋势策略（SMA: Trend-following strategy using moving average crossovers）
- 通过短期和长期简单移动平均线（SMA）的交叉（如黄金交叉/死亡交叉）判断趋势方向，追随趋势交易

性能指标

累计回报及年化收益(盈利能力)：投资组合价值总百分比变化。
夏普比率(风险收益平衡能力)：风险调整后回报，计算每单位波动率超过无风险利率的平均回报。
最大回撤(抗风险能力)：从峰值到谷值的最大损失。

结果为 TradingAgent 在 AAPL, GOOGL, and AMZN三支股票上的回测数据表现

苹果公司股票上的累计回报高达 26.62%, 远超其他交易策略
谷歌股票上回报率 16%
亚马逊gu票的回报率 4%

【2025-7-9】FinSphere

【2025-7-9】哥伦比亚大学股票分析 agent FinSphere，基于实时数据库定量工具的对话式股票分析代理

Introducing FinSphere: A real-time stock analysis agent
论文 FinSphere, a Real-Time Stock Analysis Agent Powered by Instruction-Tuned LLMs and Domain Tools
解读

金融领域大语言模型面临两个主要限制：

一是股票分析的深度不足
二是缺乏有效的客观评估标准。

FinSphere 对话型股票分析代理，由三个关键组件构成：

Stocksis，经过行业专家精心策划的数据集，旨在提升LLM进行股票分析的能力；
AnalyScore，用于系统化评估股票分析质量的框架；
FinSphere，作为一款能够生成高质量股票分析报告的人工智能代理。

即使其他通用或特定领域的LLM以及现有的代理系统拥有实时数据访问权限和一定程度的指导，FinSphere在分析精度和实际运用效果上依然表现得更为出色。

【2025-8-2】Kronos K线图大模型

【2025-8-2】清华全球首个 K 线大模型 Kronos，免费开源笔记本就能跑，改写交易玩法

论文 Kronos: A Foundation Model for the Language of Financial Markets
解读国内首个开源金融K线基础模型Kronos
应用：Kronos+miniQMT预测股票

【2026-1-6】QuantAgent

2026年1月6日，QuantAgent: 面向高频交易的多智能体框架，代码开源

论文链接：https://arxiv.org/pdf/2509.09995
代码链接：https://github.com/Y-Research-SBU/QuantAgent

“近年来大语言模型（LLMs）在金融推理和市场理解中展现出强大能力，如TradingAgent和FINMEM等多智能体框架已应用于长期投资任务。然而，这些系统无法满足高频交易（HFT）对高速、高精度决策的需求——HFT依赖技术指标、图表模式和趋势特征等结构化短周期信号，而非传统LLM依赖的长期语义推理。为此，本文提出QuantAgent，首个专为高频算法交易设计的多智能体LLM框架。系统将交易分解为指标代理（IndicatorAgent）、模式代理（PatternAgent）、趋势代理（TrendAgent）和风险代理（RiskAgent），各代理通过领域工具和结构化推理捕捉市场动态。在比特币、纳斯达克期货等10种金融工具的零样本评估中，QuantAgent在4小时交易窗口内的预测准确率显著优于随机基线，验证了结构化金融先验与语言推理结合的潜力。”

【2026-4-14】AlphaAgentEvo

【2026-4-14】中山大学 4B小模型量化因子挖掘框架 AlphaAgentEvo

论文：AlphaAgentEvo: Evolution-Oriented Alpha Mining via Self-Evolving Agentic Reinforcement Learning
论文承诺接收后开源，目前暂无官方GitHub

因子挖掘的三条路，为什么都不够好?

路线一：人类专家手搓 —— 逻辑清晰，但效率太低
- 量化研究员根据自己的金融知识和经验，手动设计因子公式。比如 WorldQuant的Alpha101，就是101个人工设计的因子。优点是逻辑清晰、可解释，缺点是效率太低了。人类一天能想几个因子？而且人的思维有盲区，很多维度根本想不到。
路线二：遗传编程（GP）随机变异 —— 自动化但效率有限
- 借鉴生物进化的思路，让因子公式像基因一样随机变异和交叉，然后通过回测筛选出好的。优点是自动化，缺点是根本不理解自己在干什么。它不懂什么是动量，什么是均值回归，就是瞎猫碰死耗子。更关键的是从不总结失败的原因，每次都是从头来。
路线三：大模型写因子 —— 最流行，但大模型黑箱
- 同团队前作AlphaAgent的路线，目前最时髦。让大模型来写因子公式，理论上它既懂金融知识又能理解自然语言指令。但问题是：大模型是黑箱，你没法让它从失败中系统性地学习。每次调用API都是独立的，不会因为你上次给了差评就在下次做得更好。而且大模型太贵，长期用不起。

AlphaAgentEvo 走第四条路：让一个小模型通过强化学习自己学会挖因子，而且越挖越厉害。

AlphaAgentEvo的整体框架，左边是单轮交互流程（思考、提出因子、回测反馈），右边是多轮训练过程（同一种子的多条轨迹一起做优势估计和策略更新）

XQuant 教程

【2026-6-21】XQuant：人人都是量化交易员

开源量化交易入门教程（目前为书稿形式），由 xingwudao（邢无刀）编写并持续迭代。采用 VitePress 构建，在线阅读体验极佳，内容完全免费。核心价值在于极其实践导向：

从「跑通第一个策略」开始，一步步选资产（从 3 只 ETF 起步）、决定仓位分配、设置再平衡/止损止盈
如何判断策略好不好、如何防止过拟合
最后实盘执行、监控诊断、迭代优化
最后引入因子研究入门，持续发现新机会整本书像一本「量化交易实操手册」，而不是空谈理论。配套还有独立练习仓库（含代码和 notebook），读完就能动手练。

【2026-7-1】go-stock

【2026-7-1】go-stock：支持 A 股、港股、美股牛逼的仓库

AI赋能股票分析：AI加持的股票分析/选股工具。股票行情获取，AI热点资讯分析，AI资金/财务分析，涨跌报警推送。支持A股，港股，美股。支持市场整体/个股情绪分析，AI辅助选股等。数据全部保留在本地。支持DeepSeek，OpenAI， Ollama，LMStudio，AnythingLLM，硅基流动，火山方舟，阿里云百炼等平台或模型
基于 Go + Wails + Vue3 + NaiveUI 搭的 AI 股票分析工具。
最大的亮点：A 股、港股、美股三市场通吃，ETF/基金也在路上了

go-stock 核心亮点：

实时行情一屏看全：分时图、K线（日/周/月）、涨跌幅一目了然
AI 智能分析：个股技术面 + 消息面 + 资金面，一键生成分析报告
市场情绪量化：NLP 解析新闻/研报，直接出情绪指标，不用自己翻帖
AI 智能选股：技术指标 + AI 预测双重筛选，筛完还能多轮追问
涨跌报警推送：钉钉/企业微信直达，不用盯盘
自选管理 + 成本追踪 + 盈亏计算，全在本地 SQLite，数据不出你电脑
最狠的是 AI 模型接入：DeepSeek、OpenAI、Ollama 本地跑、LMStudio、硅基流动、火山方舟、阿里云百炼主流平台全接

工程实践

关于高频量化交易的代码项目

kaggle股票预测

比赛介绍

【2022-4-7】kaggle股票预测比赛：Tokyo Stock Exchange Prediction
How do you know when to buy a stock（股票） or derivative（衍生品）? When should you sell instead? Your data science skills could help you predict markets and explore quantitative trading（[ˈkwɑːntəteɪtɪv], 量化交易）.This competition will compare your models against real future returns after the training phase is complete. This dataset contains historic data for a variety of Japanese stocks（股票） and options（期权）. Your challenge is to predict future returns. The competition will involve building portfolios ( [portˈfolɪˌo]，档案，文件夹，证券投资组合) from around 2,000 stocks eligible for predictions. Specifically, each participant will rank the stocks from highest to lowest expected returns and be evaluated on the difference between the returns of the highest and lowest 200 stocks.
Sharpe ratio：夏普指数，用来衡量每单位风险所能换得的平均报酬率

【2022-9-22】比赛分析：JPX 东京证券交易所预测01 理解竞赛

任何金融市场的成功都需要确定可靠的投资。当股票或衍生品的价值被低估时，购买就是有意义的。如果它被高估，也许就可以考虑出售。
虽然这些财务决策历来是由专业人士手动做出的，但技术为散户投资者带来了新的机会。数据科学家通过编程，根据训练模型的预测做出决策，探索量化交易。现有大量量化交易工作用于分析金融市场和制定投资策略。创建和执行这样的策略需要历史和实时数据，但是散户投资者很难获得这些数据，因为本次比赛提供了日本市场的金融数据，以便散户对市场进行最全面的分析。
Japan Exchange Group, Inc. (JPX) 是一家控股公司，经营着世界上最大的证券交易所之一，包括东京证券交易所 (TSE) 以及衍生品交易所大阪交易所 (OSE) 和东京商品交易所 (TOCOM)。 JPX 是本次比赛的主办方，并得到了 AI 技术公司 AlpacaJapan Co.,Ltd. 的支持。

目标

本次比赛将在训练阶段完成后将模型与真实的未来回报进行比较。比赛将从符合预测条件的股票（约 2,000 只股票）中建立投资组合。具体来说，每个参与者从最高到最低的预期回报对股票进行排名，并根据前 200 只股票和后 200 只股票之间的回报差异进行评估。比赛提供日本市场的财务数据，例如股票信息和历史股票价格，以训练和测试模型。

#导入需要的库
import numpy as np 
import pandas as pd 
import os
import matplotlib.pyplot as plt
sample = pd.read_csv(r"jpx-tokyo-stock-exchange-prediction\example_test_files\sample_submission.csv")
sample
sample.nunique() # 按日期和证券代码（股票）预测排名

按日期和证券代码（股票）预测排名。

Date	SecuritiesCode	Rank	
2021-12-06	1301	0
2021-12-06	1332	1
2021-12-06	1333	2
2021-12-06	1375	3
2021-12-06	1376	4

Rank 表示 2000 只股票中每只股票次日和次日收盘价（Close）变化率的排名，从 2000 只股票中最大的一个开始排序。（变化率大的话就是正方向，变化率小的话就是负方向大。）

评估指标

提交是根据每日买卖价差的夏普比率(sharpe ratio)进行评估的，需要对给定日期的每只活跃股票进行排名。单日回报将排名最高的 200 只股票（例如 0 到 199）视为买入，将排名最低的 200 只股票（例如 1999 到 1800 股）视为卖空。然后根据股票的排名对股票进行加权，并假设股票在第二天购买并在第二天卖出，从而计算投资组合的总回报。

数据概览

stock_prices.csv 核心数据集,包括每只股票的每日收盘价和目标行。
options.csv 基于大盘的各种期权的状态数据。许多选项包括对股票市场未来价格的隐含预测，因此即使这些选项没有直接评分，也可能会引起人们的兴趣。
secondary_stock_prices.csv 核心数据集涵盖了2000 种最常交易的股票，但许多流动性较低的证券也在东京市场上交易。该文件包含这些证券的数据，这些证券没有评分，但可能对评估整个市场有帮助。
trades.csv 上一个交易周的交易量汇总。
Financials.csv 季度收益报告的结果。
stock_list.csv - 安全码和公司名称之间的对应关系，以及有关公司所在行业的一般信息

计算过程

过程

计算rate值：计算出来的rate与原数据中的target是一致的
排序计算
- 只关注一天内的情况。（请注意，并非所有 2000 只股票都有数据，具体取决于日期。）
每日价差收益
分数计算

stock_prices = pd.read_csv(r"jpx-tokyo-stock-exchange-prediction\train_files\stock_prices.csv")
stock_prices["Date"] = pd.to_datetime(stock_prices["Date"])
# 仅看一支股票
tmpdf = stock_prices[stock_prices["SecuritiesCode"]==1301].reset_index(drop=True)
tmpdf.head(3)
# 计算rate值
tmpdf["Close_shift1"] = tmpdf["Close"].shift(-1)
tmpdf["Close_shift2"] = tmpdf["Close"].shift(-2)
tmpdf["rate"] = (tmpdf["Close_shift2"] - tmpdf["Close_shift1"]) / tmpdf["Close_shift1"]
# 排序结果计算
tmpdf2 = stock_prices[stock_prices["Date"]=="2021-12-02"].reset_index(drop=True)
#按目标降序排列。Rank与0-1999绑定，所以不要忘记-1（不输入会报错）
tmpdf2["rank"] = tmpdf2["Target"].rank(ascending=False,method="first")-1
tmpdf2 = tmpdf2.sort_values("rank").reset_index(drop=True)
# 计算每日价差
#前200支股票
tmpdf2_top200 = tmpdf2.iloc[:200,:]
# tmpdf2_top200 = tmpdf2_top200.sort_values("rank",ascending = False).reset_index(drop=True)
weights = np.linspace(start=2, stop=1, num=200)
tmpdf2_top200["weights"] = weights
tmpdf2_top200["calc_weights"] = tmpdf2_top200["Target"] * tmpdf2_top200["weights"]
Sup = tmpdf2_top200["calc_weights"].sum()/np.mean(weights)
#后200支股票
tmpdf2_bottom200 = tmpdf2.iloc[-200:,:]
tmpdf2_bottom200 = tmpdf2_bottom200.sort_values("rank",ascending = False).reset_index(drop=True)
tmpdf2_bottom200["weights"] = weights
tmpdf2_bottom200["calc_weights"] = tmpdf2_bottom200["Target"] * tmpdf2_bottom200["weights"]
Sdown= tmpdf2_bottom200["calc_weights"].sum()/np.mean(weights)

daily_spread_return = Sup - Sdown
daily_spread_return
# 分数计算
#定义一个函数实现上述过程
import numpy as np
import pandas as pd

def calc_spread_return_sharpe(df: pd.DataFrame, portfolio_size: int = 200, toprank_weight_ratio: float = 2) -> float: 
    """
    Args:
        df (pd.DataFrame): 预测结果
        portfolio_size (int): 投资组合规模
        toprank_weight_ratio (float):  排名最高的股票与排名最低的股票的相对权重。
    Returns:
        (返回一个浮点数): sharpe ratio 夏普比率
    """
    def _calc_spread_return_per_day(df, portfolio_size, toprank_weight_ratio):
        assert df['Rank'].min() == 0  #不出错则跳过，出错则返回异常
        assert df['Rank'].max() == len(df['Rank']) - 1
        weights = np.linspace(start=toprank_weight_ratio, stop=1, num=portfolio_size)
        Sup= (df.sort_values(by='Rank')['Target'][:portfolio_size] * weights).sum() / weights.mean()
        Sdowm = (df.sort_values(by='Rank', ascending=False)['Target'][:portfolio_size] * weights).sum() / weights.mean()
        return purchase - short
     #按照日期计算每天的价差收益
    buf = df.groupby('Date').apply(_calc_spread_return_per_day, portfolio_size, toprank_weight_ratio) 
    sharpe_ratio = buf.mean() / buf.std()
    return sharpe_ratio

数据源

实时股价数据

新浪股票实时数据接口: http://hq.sinajs.cn/list=sh600389

基础教程

stochastic: 常见随机过程的实现，包括连续、离散、扩散过程、噪声等类别；
ou_noise: O-U过程的生成、检验和参数估计；
hawkes: 关于单变量以及多变量Hawkes过程的生成与参数估计，采用MAP EM算法进行参数估计；
TimeSeriesAnalysisWithPython: 基础时间序列教程，包括时间序列数据的读取、趋势成分与季节成分的分解、谱分析、聚类等内容；
yangwohenmai: 进阶时间序列教程，包括基于统计学、基于LSTM、基于深度学习进行时间序列预测的内容；
leetcode-master: 数据结构与算法的刷题攻略，持续更新中；
Advanced-Algorithmic-Trading: 《Advanced Algorithmic Trading》一书的代码实现，使用语言为python/R；
bukosabino: 一位Affirm算法工程师的项目主页，内容丰富，包括TA库的实现、时间序列预测、特征工程选择等，主要集中于机器学习领域；

订单簿分析与做市策略

LOB-feature-analysis: 对限价订单簿进行特征工程分析，包括订单大小的分布、用于价格预测的订单不平衡、知情交易的概率、波动性等方面。作者的文档与代码简洁清晰，包含部分原始文献；
HFT_Bitcoin: BTC订单簿的数据分析以及一些传统高频策略的实例图示；
High-Frequency: 基于level-2限价订单簿和分笔交易数据的研究，考察了订单不平衡与买卖压力的盘口拓展；
High-Frequency-Data—Limit-Order-Books: 本项目包括高频数据描述性分析，Hawkes过程的生成与参数估计以及限价订单簿的模拟；
https://github.com/Macosh/Order_Book: 一个订单簿模拟器，实现了创建不同类型的订单、订单匹配、模拟生成，数据库存储历史订单等功能；
avellaneda-stoikov: Avellaneda-Stoikov做市算法的实现；
Avellaneda-Stoikov: Avellaneda-Stoikov做市算法另一个实现版本，比前者更简明些；
jshellen/HFT: 采用随机最优控制方法求解AS做市算法及其变种，包含HJB方程的求解程序以及AS做市策略的输出框架；
OptimalExecution_stochastic_control: 本项目实现了Frei, C. and N. Westray (2015). Optimal execution of a vwap order: a stochastic control approach. Mathematical Finance 25(3), 612–639.一文提出的VWAP算法的最优执行，项目包括数据过程，参数校准，存货变动轨迹等；
Order-Execution-Strategy: 三种最优订单执行策略的实现，此外还有Almgren-Chriss框架下的市场冲击函数的实现；
machine-learning-market-maker: 《Intelligent Market-Making in Artificial Financial Market》一文的实现，基于贝叶斯估计的做市策略模型；
armoreal/hft: 高频交易策略，测试了隐马尔科夫模型（HMM）与O-U过程对限价订单簿数据的拟合情况；此外，还测试了几种典型的高频因子；

传统技术分析、对冲

quantitative_research_report: 一些券商研报的复现；
bitmex-algo: 基于BitMEX平台ETH/USDT和XBT/USDT1分钟的交易数据的交易策略，采用传统技术分析指标进行交易；
AlgoBot: 一个使用均值回归或趋势跟踪策略的自动交易机器人；
High-Frequency-of-BTC-strategy: 跨交易所的BTC高频对冲策略；
options-market-making: 基于期权市场的交易机器人，包含做市、统计套利、delta和vega对冲等；
World_Quant_Alphas: World Quant 101 alphas的计算和策略化；

机器学习

SGX-Full-OrderBook-Tick-Data-Trading-Strategy: 采用机器学习方法对限价订单簿动态进行建模的量化策略，包括数据获取、特征选择、模型选择，可作为机器学习类策略的baseline；

深度学习

《Pytorch深度学习实践》课程对应的代码, 很好的深度学习入门指引；
lstm: 一个LSTM的简单实现；
HighFrequency: 采用神经网络方法预测微观层面的价格跳跃，项目完整度较高，从获取数据、异常值清洗、跳跃的统计检验到LSTM、CNN、注意力机制等方法的预测应用；
AlgorithmicTrading-MachineLearning: 用RNN，LSTM，GRU预测股价变动；

强化学习

drlformm:《Deep Reinforcement Learning for Market Making Under a Hawkes Process-Based Limit Order Book Model》一文的代码实现，基于Hawkes过程的深度强化学习做市策略；
algorithmicTrader: 一个采用强化学习进行算法交易的项目；
moneyMaker: 一个基于强化学习的算法交易策略；
TikhonJelvis/RL-book: 《Foundations of Reinforcement Learning with Applications in Finance》一书的对应代码实现；
dq-MM: Deep Q-Learning用于做市，依赖于开源项目Trading Gym；

量化交易-Quantitative Trading