面前,大模子不错帮你梳理新闻时期线了彩娱乐app,以后吃瓜就更便捷了!
AI Agent的风,我们赛博乐子东谈主也得吹吹。
这即是来自阿里巴巴通义实验室与上海交通大学的新讨论,他们建议了一种基于Agent的新闻时期线摘抄新框架——CHRONOS。
它不仅不错帮你从海量新闻中转头出挫折事件,更挫折的是,它还不错梳理出明晰的时期线,以后上网冲浪时各式复杂事件都一目了然。
其中的CHRONOS一词取自希腊据说中的时期之神柯罗诺斯。
该框架通过迭代多轮的自我发问时势,衔尾检索增强生成技巧,从互联网上检索讨论事件信息,并生成时期法例的新闻摘抄,为新闻时期线摘抄生成提供了一种全新的处分有想象。
先来沿途瞅瞅几个例子。
比如对于新闻“国足1-0巴林”,CHRONOS约略转头海量新闻,呈现事件的一脉相通。
对于袒护时期更长的新闻“中国探月工程”,CHRONOS也能聚焦重苦衷件,呈当前期线发展,使得用户约略一目了然。
补皆敞开域TLS短板
时期线转头(Timeline Summarization, TLS)任务是一种当然话语处理界限的经典技巧挑战,它旨在从多数文本数据中索取关键事件,并依时间法例成列,以提供对某一主题或界限历史发展的结构化视图。
举例,在新闻界限,时期线转头不错匡助用户快速了解一个新闻事件的一脉相通。该任务不仅条件识别出挫折的事件,还需方法会事件之间的时期关系和因果讨论,以便生成一个连贯、简陋且信息丰富的时期线摘抄。
凭据可检索事件的开首,不错将TLS任务细分为闭塞域(closed-domain)和敞开域(open-domain)两个设定:在闭塞域TLS任务中,时期线是从一组预界说的、与特定主题或界限讨论的新闻著作中创建的,而敞开域TLS指的是从互联网上径直搜索和检索新闻著作来生成时期线的历程。
已往的责任东要聚集于处分闭塞域上时期线生成问题,而敞开域TLS则需要弘大的信息检索和筛选能力,以及在莫得全局视图的情况下识别和建设事件之间讨论的能力,为这项任务建议了新的要乞降挑战。
“我们一直在告诉本(华莱士),‘需要犯规时就犯规,但不要让自己陷入犯规麻烦。如果你需要放弃上篮,没关系,我们会在另一边得到我们想要的。’接下来发生的事情是,科比会因为没有触球而有点沮丧。”
可这位女子的表情和行为却让人无语,不知道她是真的清纯女子,只是被骗还是一个天生的演员,把一切“罪孽”推到无知的头上,可这种无知却并不可爱。
迭代检索的CHRONOS框架
为了应付上述挑战,团队建议CHRONOS框架,通过迭代发问进行讨论事件检索,生成准确、全面的时期线摘抄,约略灵验地处分敞开域和闭塞域两种设定下的TLS任务。
1. 动机
时期线生成的中枢在于建设事件之间的时期和因果关系。
每个新闻事件都不错被示意为一个不同的节点,任务的标的是建设这些节点之间的边,以展示它们的讨论性,并最终造成一个异构图,从主题新闻的节点开赴点。
因此,通过一个检索机制来检索讨论的新闻著作,不错灵验建设这些边,造成事件之间的讨论。
2. 详细
CHRONOS期骗大模子的能力,通过模拟东谈主类信息检索的历程,即通过建议问题、基于检索放肆进一步建议新的问题,最终网罗对于讨论事件的全面信息并转头为时期线。
CHRONOS包括以下几个模块:
自我发问 (Self-Questioning):率先搜索粗粒度的新闻布景信息,然后迭代地建议问题,以检索更多讨论新闻。
问题改写 (Question Rewriting):将复杂或领路欠安的问题领悟为更具体、更易检索的查询。
时期线生成 (Timeline Generation):通过清除每一轮检索生成的时期线来转头一个凸起挫折事件的时期线。
3. 自我发问3.1 粗粒度布景调研
在自我发问的启动阶段,CHRONOS使用标的新闻的标题动作关键词进行搜索,以网罗与标的新闻最径直讨论的信息。
这些信息组成了新闻布景(News Context),为自我发问打下初步基础。
3.2 发问示例聘用
在粗粒度布景调研之后,CHRONOS期骗大模子的凹凸体裁习能力,彩娱乐邀请码通过小数样本领导来携带模子生成对于标的新闻的问题。
为了评估问题样实质地,引入了时序信息量(Chrono-Informativeness, CI)的意见,用来筹画模子建议的问题检索与参考时期线对皆事件的能力,即高CI值的问题更有可能同样检索到与标的新闻事件讨论的著作,用检索生成的时期线和参考时期线中包含日历的F1分数进行筹画。
基于最大化问题集时序信息量的标的,构建一个“新闻-问题”的示例池,用于携带新标的新闻的问题生成。
对于每个新的标的新闻,通过余弦相似性动态检索与标的新闻最相似的样本,确保了样本的凹凸文讨论性和时期信息的准确性。
3.3 迭代发问
CHRONOS通过连气儿迭代发问,迟缓长远探索事件的细节。
每一轮迭代都基于前一轮的检索放肆,以发现新的问题和信息,直到知足时期线中事件数目或达到最大迭代次数。
3.4 问题改写
查询改写(Query Rewriting)是检索增强生成中常用的优化关键。
在CHRONOS框架中,团队通过对启动发问阶段产生的泛泛或复杂问题改写为2-3个更易于检索的子问题,约略生成更具体、更有针对性的查询,从而提高搜索引擎的检索着力。
他们同样在领导中加入小数样本,携带大模子进行灵验改写,将复杂问题调度为更具体的查询,同期保握问题的原始意图。
3.5 时期线生成
CHRONOS通过两阶段生成竣工的时期线转头:生成(Generation)和清除(Merging)。
生成:通过分析每一轮检索到的新闻著作来识别关键事件和详备信息。期骗大模子的相识和生成能力,索取每个事件的发寿辰期和讨论细节,并为每个事件撰写简陋的花式。这些事件和花式被组织成初步的时期线,按照时期法例成列,为后续的清除阶段提供基础。
清除:将多轮检索生成的初步时期线整合成一个连贯的最终摘抄。这一历程波及对皆不同时间线中的事件、处分任何日历或花式上的冲破,并聘用最具代表性和挫折性的事件。
全新数据集OPEN-TLS
为了评估TLS系统,讨论团队还网罗了由专科记者撰写的对于近期新闻事件的时期线,构建了一个名为Open-TLS的新数据集。
与以往闭塞域的数据集比拟,Open-TLS不仅在数据集限度和内容上愈加万般化,袒护政事、经济、社会、体育和科学技巧等多个界限,况兼在时效性上更具上风,为敞开域TLS任务提供了一个更全面和更具挑战性的基准。
实验放肆
1. 实验设定
实验基于GPT-3.5-Turbo、GPT-4和Qwen2.5-72B分离构建CHRONOS系统,评测敞开域和闭塞域两个设定下TLS的性能领路。使用的评估目的主要有:
ROUGE-N: 筹画生成时期线和参考时期线之间的N-gram类似。具体包括:(1)Concat F1:通过将所有日历摘抄集结起来预计ROUGE,以评估举座的一致性;(2)Agree F1:仅使用匹配日历的摘抄预计ROUGE,以评估特定日历的准确性;(3)Align F1:在预计ROUGE之前,先凭据相似性和日历接近性对瞻望摘抄和参考摘抄进行对皆,评估对皆后的一致性。
Date F1:筹画生成时期线中日历与参考时期线中真确日历匹配进度。
2. 敞开域TLS
在敞开域TLS的实验中,CHRONOS与几个基线关键进行了比较,包括径直搜索标的新闻(DIRECT)和重写标的新闻以创建查询用于检索(REWRITE)。
对比之下,CHRONOS通过迭代自我发问和检索讨论新闻著作的关键,权臣提高了事件转头的质地和日历对皆的准确性,在所有目的上都特出于基线关键。
3. 闭塞域TLS
在闭塞域TLS的实验中,CHRONOS与之前的代表性责任进行了比较,包括:(1)基于事件团聚关键的CLUST (Gholipour Ghalandari and. Ifrim, 2020);(2)基于事件图模子EGC(Li et al., 2021)和(3)期骗大模子进行事件聚类的LLM-TLS(Hu et al., 2024)。
在Crisis和T17这两个经典数据集上的比较放肆表示,CHRONOS达到了与这些责任类似的领路,在两个数据集的AR-2目的上获取了SOTA着力,说明了其在不同类型事件和时期跨度上的弘大性能和相宜性。
4. 运行时期分析
CHRONOS的另一个上风体面前着力方面。
与同样基于大模子、但需要处理新闻库中所有著作的LLM-TLS关键比拟,它通过检索增强机制专注于最讨论的新闻著作,权臣减少了处理时期。
这种着力的晋升使其在实践应用中更为实用,尤其是在需要快速反馈的场景中。
案例讨论:苹果居品发布时期线
团队长远分析了模子在处理具体新闻事件时的领路,通过聘用具有代表性的新闻事件,如苹果公司的要紧居品发布,约略不雅察到CHRONOS怎样通过行远自迩的自我发问和信息检索来生成时期线。
在案例讨论中,CHRONOS展示了其约略准确索取关键事件和日历的能力,同期也揭示了在某些情况下可能需要编削的方位,举例对某些事件的遗漏或日历幻觉。
结语
CHRONOS框架通过衔尾大型话语模子的迭代自我发问和检索增强生成技巧,为时期线转头任务提供了一种新颖且灵验的处分有想象。
这种关键的中枢在于模拟东谈主类的信息检索历程,通过不断地建议和回应新问题来迟缓长远相识事件,最终身成一个全面且连贯的时期线摘抄。
实验放肆一经充分说明了CHRONOS在复杂事件检索和构建时期线方面的能力,展示了该框架在实践新闻时期线生成应用中的应用后劲和准确性。
同期,这种迭代发问的检索生成关键是否具有泛化到通用任务上的能力也值得将来进一步讨论。
Reference:
[1] Demian Gholipour Ghalandari and Georgiana Ifrim. 2020. Examining the state-of-the-art in news timeline summarization. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 1322–1334, Online. Association for Computational Linguistics.
[2] Manling Li, Tengfei Ma, Mo Yu, Lingfei Wu, Tian Gao, Heng Ji, and Kathleen McKeown. 2021. Timeline summarization based on event graph compression via time-aware optimal transport. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 6443–6456, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.
[3] Qisheng Hu, Geonsik Moon, and Hwee Tou Ng. 2024. From moments to milestones: Incremental timeline summarization leveraging large language models. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 7232–7246, Bangkok, Thailand. Association for Computational Linguistics.
— 完 —彩娱乐app
上一篇:彩娱乐app 蚂蚁保发布《2024保障劳动年度趋势不雅察》 储蓄型保障走红 新动力车险增长 下一篇:彩娱乐app 一双“猫奴”新婚爱妻,买下130㎡双阳台婚房,打造奶油极简调治家!