孵化 DeepSeeDpSk人工智能k 的量化交易:一个数据驱动的隐秘世界

  DeepSeek     |      2025-03-17 12:07

  DeepSeek是一款基于AI技术的智能搜索引擎,结合深度学习与自然语言处理,提供精准、高效的搜索体验。探索DeepSeek,感受未来智能搜索的无限可能!1994 年,量化公司是当时最神秘最热门的技术公司,他们雇用数学家和物理学家,成批买来高性能计算机做交易。

  这个行业里的标杆公司是 D.E. Shaw,它能在一天内贡献纽交所超 2% 的订单量。

  另一个副总裁离职,带着自己和老板讨论产生的好点子开车去了西雅图,做出了全世界的电商鼻祖、市值超过 20000 亿美元的亚马逊。

  管理数百亿元的中国头部量化公司幻方,推出大语言模型 DeepSeek R1。

  贝索斯创办亚马逊,或者梁文锋造出 DeepSeek 的主要原因自然不是因为他们做过量化,而是因为他们骨子里都是创业者。

  但量化投资这个极度追求人才密度且极度保密的行业文化,确实提供了适合大模型研发的环境。

  基金经理们也钻研公开的财务资料,但他们同样乐于组织业内人士研讨会、支付每小时上千元的专家咨询费,甚至 雇上千人守在咖啡店门口拍视频 ,只为更早获得独家信息,抢先同行一步下注。

  尽管桥水基金创始人瑞 · 达利欧把利率、汇率的变动原理写成书,反复讲桥水基金凭它们投资,但《》的记者觉得达利欧赚钱的真正秘诀是讨好宏观政策决定者,靠他们 “透题” 赚钱,也写了本书论证。

  人类行为总是不断重复,因此价格运动有规律可循,而计算机可以捕捉到这个规律。

  如果两家公司股价差距没来由地扩大或收窄,那至少有一家定价错误、价差总要回归。

  四十年前,先发现这个机会的投资者靠程序监测六、七只相关股票的价差变动,就能撑起一只管理 3000 万美元的基金。

  可口可乐的投资者中总有自信过头的,他们会更倾向于跟着自己喜欢的消息买入,而把自己不喜欢的消息当作噪音。

  学界发现过去收益好的公司,未来大概率还会好下去,把这规律称为 “动量效应”。

  他的工作就是找到能刻画规律、解释波动的 “因子”,基于它们构建投资策略。

  可口可乐未来走势与百事可乐过往股价、可口可乐过往涨幅相关,股价、涨幅数据就能作为 “因子” 投入量化模型。

  他第一任期内,J.P. Morgan 的研究员通过程序分析特朗普上万条推文的语义、构建 “Volfefe” 指数,并验证它可以解释美国国债利率变动。

  机器学习方法在量化行业普及后,很多左右股价变化的因子已经完全无法用逻辑理解。

  研究员确定评价因子的标准,输入开盘价、收盘价、成交量等 “原始因子”,程序就能自动组合、迭代出更能预测股价的新因子。

  投资机构 WorldQuant 曾分享过一个实际用于交易的 “较为简单” 的因子:

  除了能增加因子对价格的解释能力外,没人知道公式中的 0.178404 等数字有什么现实意义。

  “如果是意义非常明显的信号,早就被用于交易了。有些信号你不理解,但它们就在那里,而且可能相对较强。”文艺复兴 CEO 彼得 · 布朗说。

  量化研究员轩浩告诉我们,基于现实意义、拍脑袋想因子十分困难,“一天能想十个,就是天才了”。

  头部量化公司会要求离职员工 18-24 个月内既不能自己交易、也不能去其他公司任职。

  D.E. Shaw 创始人大卫 · 肖曾说自己公司安保水平媲美中央情报局。

  被记者问 D.E Shaw 是否用神经网络算法构思策略时,这名拥有数十亿美元财富的创始人回答:

  “我们只在 50.75% 的情况下是对的。” 一名员工说,但这已足够成就公司大奖章基金一年管 38 亿美元、赚 21 亿美元的成绩。

  2014 年比赛夜的参与者有陶哲轩,他 24 岁成为加州大学洛杉矶分校数学系终身教授,31 岁获得 “菲尔兹奖”——数学界的诺贝尔奖。

  不过他只是第二,赢过他的是约翰 · 奥弗德克,量化公司 Two Sigma 的联合创始人。

  2015 年时,这家公司已经招了 130 名博士和 6 名国际数学奥林匹克竞赛获奖者。

  奥弗德克前东家 D.E. Shaw 直接说自己招聘时有 “毫无歉意的精英主义”。

  前美国财政部长、哈佛大学校长劳伦斯 · 萨默斯在 2006 年想去 D.E. Shaw 工作,同样要做智力测验。

  受量化公司青睐的候选人往往来自数学、计算机、统计学等专业,金融、商科背景不是加分项。

  创立幻方前,梁文锋在浙江大学读通信工程,之后也偏好雇高中或大学时参加全国或国际学科竞赛,比如 NOI(全国青少年信息学奥林匹克竞赛)、IOI (国际信息学奥林匹克竞赛),拿到好名次、最好是金牌的年轻人。

  没竞赛背景,最好本科能考上北大、浙大、清华等高校,学计算机、电子信息工程专业。

  “科学家做这行的优势不是数学或计算能力,而在于他们的科学思维。”西蒙斯说,他们更不可能接受统计学上的偶然事件。

  2022 年 2 月,一名拿过奖的首席分析师写 “定量分析” 研报说宁德时代未来可能跌超 20%。

  一年前,同为行业龙头的贵州茅台面临相似的市场环境,两家公司股价走势长得也像,他据此推测茅台过去的跌幅可以指引宁德时代的未来表现。

  Two Sigma 面试员工时,一个例题是如何用数学方法验证 “CEO 离职,公司股价下跌”。

  幻方总部位于杭州,它和同行们的北京办公室也聚集在清华科技园,而不是国贸、金融街。

  文艺复兴公司内有能容纳 100 人的礼堂,定期举办科学讲座,比如结直肠癌研究的最新进展。

  轩浩就职于一家全球顶级量化投资机构,其内部有多个小组互不透风、独立交易,就像一个个小投资机构:

  各组只要控制好风险,投资方法论并不需要一致,每年扣掉交给公司的提成、数据接口等成本后,剩下的利润都归自己所有。

  “有一个组瞄准一种另类资产,做一套策略赚了数十亿元。所有人都财富自由了。”

  研究员花大量时间用于成果展示,“如果没有取得太大的进步,你会感到有压力。” 一名员工说。

  大厂的中层管理者把手下人数与晋升机会挂钩,不会轻易允许下属参与其他团队分工,自己还要在双月会上争抢更多业务领地。

  所有人都要在 KPI 或 OKR 中提前写定自己下周、下个月、下个季度要干什么。

  “我们一般不前置分工。” 梁文锋说,员工没有 KPI,“遇到问题,自己就会拉人讨论。” 当想法显出潜力,公司会自上而下调配资源。

  把数十亿美元交给机器打点,完全相信它们是件反人性的事,哪怕对行业先驱也如此。

  缓解焦虑不是靠退回人工干预,而是穷尽数据、算力,将算法的潜力发挥到极致。

  文艺复兴的数据库从 18 世纪开始,现在 “每天增长 40TB(1TB = 1000GB)”,他们还有 “52000 个计算核心与 150GB 每秒的全球传输速度”。

  模型说要下 1000 单,那应该在 10 秒、20 秒还是 1 分钟内执行完?

  卖的时候,是线%、市场交易量变小的时候,还是趁有人愿意买,涨 15% 就提前止盈?

  伊黎试过从文本信息中提取因子,先人工看完 1000 条样本、打上标签,用它们训练一个自动打标的语义分析模型,还要训练另一个模型验证打标准确性。

  GPT 模型理论架构最早来自 Google,OpenAI 成为最终受益者,是因为敢在前景模糊时,租卡、买数据,花千万美元一次又一次训练更大的模型。

  一个量化从业者感慨梁文锋从浙大信息与通信工程专业毕业后,没有选择当时很好、之后会更好的就业机会,自己花几年闭门琢磨用算法买股票——

  到了 2021 年,大语言模型的影响主要还停留在学界,ChatGPT 没诞生。

  当时头部量化投资公司个个用了机器学习,但只有幻方花出上亿元买来一万张英伟达显卡,运行各种大型 AI 模型。

  【投资人说】正在组建超级投资者社群、超级创业者社群、超级读者群、超级媒体群等,目前总人数已超1000人。

  关注【投资人说】微信公众号,发送信息「进群」,与各行业精英直接交流,共同进步。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  马科斯家族崩塌!莎拉怒斥清算之日,亲姐真面目遭全球围观

  罗马诺:切尔西可以支付一定费用将桑乔送回曼联;拉爵:曼联仍然没有数据分析,只能靠威尔考克斯的眼睛

  《编码物候》展览开幕 北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律

  AMD 称 Radeon 显卡在日市占达 45% 高点,AIB 表示 GPU 供应不足