利用大型语言模型揭示隐藏因果关系的挑战与突破
因果关系的发现与分析是科学研究的核心,但现有的因果发现算法依赖于预先定义的高级变量,而这些变量在现实世界中往往匮乏。尤其对于图片、文本等高维非结构化数据,更是如此。香港浸会大学等机构的研究人员在NeurIPS 2025发表论文《Discovery of the Hidden World with Large Language Models》,提出了一种名为COAT的新型框架,旨在利用大型语言模型 (LLM) 来克服这一难题,从而更有效地识别现实世界中的因果关系。
论文链接:https://www.php.cn/link/2fdddc426480d46ce18affae5e455c82
代码链接:https://www.php.cn/link/5807f0ed140fffaa1f35f16baf72e31b
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

研究背景
科学进步依赖于对关键变量及其因果关系的识别。传统的因果发现方法 (CDs) 依赖于人类专家提供的高质量变量,但在实际应用中,这些变量往往难以获得。例如,分析用户评分的电商卖家,只能获取用户评论等非结构化数据。因此,高级变量的匮乏限制了 CDs 方法的应用范围。
LLM 在理解非结构化数据方面展现出强大的能力,并能解决各种复杂任务。一些研究表明,LLM 可以回答因果问题,但现有方法主要将其作为因果变量的直接推理器,可靠性存疑,且缺乏对因果发现理论保证的充分讨论。因此,如何可靠地利用 LLM 揭示现实世界的因果机制成为一个关键问题。
COAT框架:LLM作为表征辅助工具
本研究的目标是利用 LLM 为非结构化数据构建结构化表征,该表征由一系列高级变量组成,能够捕捉目标信息并具有可解释性。为此,研究人员提出了 Causal representatiOn AssistanT (COAT) 框架。用户只需提供目标变量,COAT 就能迭代地寻找构成目标变量马尔可夫毯 (Markov Blanket) 的高级变量集。然后,任何合适的因果发现算法都可以用于进一步分析因果结构。
数据与目标
目标是找到一个映射函数,将非结构化数据 X 映射到高级变量集 h(X),从而构成 Y 的马尔可夫毯。
LLM 的作用:变量提出与取值解析
COAT 将映射函数分解为一系列高级变量,每个变量将原始观测映射到预定义的值空间。这些变量由 LLM 通过自然语言定义,并具有明确的物理含义。例如,“甜度”可以定义为:1 (满意),-1 (失望),0 (未提及/无法判断)。
COAT 框架包含以下步骤:
图1. COAT框架示例
图2. COAT变量提出环节Prompt示意
图3. COAT框架总结
MedPeer科研绘图
生物医学领域的专业绘图解决方案,告别复杂绘图,专注科研创新
166
查看详情
理论分析与实验结果
研究人员定义了感知分数和能力分数来衡量 LLM 提出高级变量的能力。通过理论分析和在 AppleGastronome (美食家对苹果评分) 和 Neuropathic (神经性疼痛诊断) 两个数据集上的实验,结果表明:
图5. AppleGastronome数据样例
图6. AppleGastronome相关因果图
图7. AppleGastronome实验结果
图8. LLM相关能力实验评估
图9. LLM标注噪声独立性检验
图10. AppleGastronome数据集上COAT因果结构识别评估
图11. Neuropathic数据样例
图12. Neuropathic相关因果图
图13. Neuropathic实验结果
图14. COAT探究ENSO因果机制
结论与未来展望
COAT 框架有效地结合了 LLM 和因果发现方法的优势,能够处理非结构化数据,并为因果发现提供支持。这项研究为构建用于因果发现的强大基础模型开辟了新的方向。
引用信息
@inproceedings{causalcoat2025,
ti
tle={Discovery of the Hidden World with Large Language Models}, author={Chenxi Liu and Yongqiang Chen and Tongliang Liu and Mingming Gong and James Cheng and Bo Han and Kun Zhang},year={2025},booktitle={Proceedings of the Thirty-eighth Annual Conference on Neural Information Processing Systems}}
以上就是NeurIPS 2025 | 用LLM探寻隐秘的因果世界的详细内容,更多请关注其它相关文章!
# git
# 苹果
# 2025
# 结构化
# 理论
# 用什么网站推广流量好点
# 网站的建设好处
# 线上营销卖货推广方案模板
# 邓州网站建设收费
# seo一天写几篇
# 太原小区推广员招聘网站
# 苏州网站建设程序流程
# seo优火星9服务
# 陕西华清宫景区网站建设
# seo 关键词描述
# 来袭
# 依赖于
# 开源
# 播客
# 首个
# 提出了
# 腾讯
# 还能
# 因果关系
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
优化推广96088 】
【
技术知识133117 】
【
IDC资讯59369 】
【
网络运营7196 】
【
IT资讯61894 】
相关推荐:
微软面向AI初学者推出免费网络课程
央广车联网亮相2025世界人工智能大会
探索人工智能和物联网的动态融合
传字节内测对话式 AI 产品,代号「Grace」;马斯克嘲讽苹果 头显;比亚迪 F 品牌定名「方程豹」
即时 AI再次升级 30秒生成自带动效的网页 生成速度提升100%
人工智能颠覆软件测试四大方式
特斯拉人形机器人将于 7 月亮相上海 2025 世界人工智能大会
兆讯传媒率先全面拥抱AI 数智广告内容焕发新生机
网易加速行业AI大模型应用,将覆盖100多个应用场景
参考封面|人工智能“淘金热”
AI工具助力公司实施每周4.5天工作制,带来巨大效益
IBM和NASA合作发布可追踪碳排放的开源AI基础模型
华为HarmonyOS 4将集|成人|工智能大型模型
马斯克讽刺人工智能炒作:什么“机器学习”,其实就是统计
探展WAIC |万向区块链杜宇:不存在单一技术的iPhone时刻,Web3.0核心将基于AI+区块链+物联网
AI行业盛会大咖云集!Sam Altam、“AI教父”......一文看懂最新观点
干货满满,2025昆山元宇宙国际装备展等你来打卡!
利用AI探索抗体“钥匙”、加速药物研发——访百图生科团队
Databricks 发布大数据分析平台 Spark 用 AI 模型 SDK:一键生成 SQL 及 FySpark 语言图表代码
马斯克发推讽刺人工智能:机器学习的本质就是统计
美图秀秀发布7款AI产品:支持用户创作、商业创作
微软商店 AI 摘要功能开启预览,帮助用户迅速了解应用评价
谷歌在人工智能领域没有“护城河”?
小米9号员工李明宣布创业:打造首款安卓桌面机器人
北京市通用人工智能产业创新伙伴计划名单公布,京东科技入选“算力伙伴”
“思享荟”沙龙热议AIGC与元宇宙 复旦大学赵星畅谈深度数字化
导演郭帆:人工智能应用可能会影响《流浪地球 3》的创作开发
站在社会的高度理解人工智能
2025世界人工智能大会成功召开
对Hugging Face开源模型精准投毒!LLM切脑后变身PoisonGPT,用虚假事实洗脑60亿人
猿编程参加人工智能高峰论坛,推动人工智能教育解决方案在千所学校推行
人工智能在商业中的风险和局限性
消息称字节机器人团队已有约50人,计划年底扩充到上百人
AIGC浪潮下,联想集团再加码计算与人工智能
参议院司法听证会:AI 不易管控,有可能被恶意分子利用来研发生化武器
彬州市第三届青少年机器人创新大赛成功举办
大脚攀爬者车主福利!无人机、运动相机大奖等你来挑战
微软向美国政府提供GPT大模型,如何保证安全性?
OpenAI 已全面开放 GPT-3.5 Turbo、DALL-E 及 Whisper API
人工智能驱动智能建筑会是未来趋势吗?
Midjourney 5.2震撼发布!原画生成3D场景,无限缩放无垠宇宙
元宇宙技术带你穿梭“大运河”,江苏书展上的数字阅读馆吸睛小读者
小米发布CyberDog2 - 他们的第二代仿生四足机器人展示
应对算力挑战,亚马逊云科技发力AI基础设施建设
小米又拿下国际比赛第一:AI翻译立功
管提需求,大模型解决问题:图表处理神器SheetCopilot上线
OpenAI首席执行官引用《道德经》 呼吁就AI安全问题合作
人形机器人概念集体爆发,能买吗?
找对了风口想不火都难,乐天派机器人,安卓机器人的最终形态?
国内阅读行业首款对话式AI应用“阅爱聊”封闭内测
2025-02-09
运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。