目下彩娱乐,大模子不错帮你梳理新闻时期线了,以后吃瓜就更便捷了!
AI Agent的风,我们赛博乐子东谈主也得吹吹。
这等于来自阿里巴巴通义实验室与上海交通大学的新探究,他们冷漠了一种基于Agent的新闻时期线摘要新框架——CHRONOS。
它不仅不错帮你从海量新闻中追思出进犯事件,更进犯的是,它还不错梳理出了了的时期线,以后上网冲浪时种种复杂事件都一目了然。
其中的CHRONOS一词取自希腊别传中的时期之神柯罗诺斯。
该框架通过迭代多轮的自我发问形状,衔尾检索增强生成技艺,从互联网上检索磋议事件信息,并生成时期划定的新闻摘要,为新闻时期线摘要生成提供了一种全新的措置决策。
先来一皆瞅瞅几个例子。
比如对于新闻“国足1-0巴林”,CHRONOS概况追思海量新闻,呈现事件的一脉相易。
对于消释时期更长的新闻“中国探月工程”,CHRONOS也能聚焦要点事件,呈刻下期线发展,使得用户概况一目了然。
补皆通达域TLS短板
时期线追思(Timeline Summarization, TLS)任务是一种当然言语处理边界的经典技艺挑战,它旨在从大都文本数据中索要要道事件,并依时间划定陈设,以提供对某一主题或边界历史发展的结构化视图。
举例,在新闻边界,时期线追思不错匡助用户快速了解一个新闻事件的一脉相易。该任务不仅条件识别出进犯的事件,还需要线路事件之间的时期关连和因果磋议,以便生成一个连贯、浅近且信息丰富的时期线摘要。
凭证可检索事件的起原,不错将TLS任务细分为禁闭域(closed-domain)和通达域(open-domain)两个设定:在禁闭域TLS任务中,时期线是从一组预界说的、与特定主题或边界磋议的新闻著述中创建的,而通达域TLS指的是从互联网上径直搜索和检索新闻著述来生成时期线的经过。
当年的使命东要齐集于措置禁闭域上时期线生成问题,而通达域TLS则需要弘大的信息检索和筛选才调,以及在莫得全局视图的情况下识别和建立事件之间磋议的才调,为这项任务冷漠了新的要乞降挑战。
迭代检索的CHRONOS框架
为了搪塞上述挑战,团队冷漠CHRONOS框架,通过迭代发问进行磋议事件检索,生成准确、全面的时期线摘要,概况有用地措置通达域和禁闭域两种设定下的TLS任务。
1. 动机
时期线生成的中枢在于建立事件之间的时期和因果关连。
每个新闻事件都不错被示意为一个不同的节点,任务的标的是建立这些节点之间的边,以展示它们的磋议性,并最终酿成一个异构图,从主题新闻的节点入手。
因此,通过一个检索机制来检索磋议的新闻著述,不错有用建立这些边,酿成事件之间的磋议。
2. 概括
CHRONOS运用大模子的才调,通过模拟东谈主类信息检索的经过,即通过冷漠问题、基于检索戒指进一步冷漠新的问题,最终网罗对于磋议事件的全面信息并追思为时期线。
CHRONOS包括以下几个模块:
自我发问 (Self-Questioning):当先搜索粗粒度的新闻配景信息,然后迭代地冷漠问题,以检索更多磋议新闻。
问题改写 (Question Rewriting):将复杂或推崇欠安的问题判辨为更具体、更易检索的查询。
时期线生成 (Timeline Generation):通过归并每一轮检索生成的时期线往复首一个凸起进犯事件的时期线。
3. 自我发问3.1 粗粒度配景调研
在自我发问的入手阶段,CHRONOS使用标的新闻的标题行为要道词进行搜索,以网罗与标的新闻最径直磋议的信息。
这些信息组成了新闻配景(News Context),为自我发问打下初步基础。
3.2 发问示例聘任
在粗粒度配景调研之后,CHRONOS运用大模子的荆棘体裁习才调,通过极少样本辅导来率领模子生成对于标的新闻的问题。
为了评估问题样内容量,引入了时序信息量(Chrono-Informativeness, CI)的倡导,用来量度模子冷漠的问题检索与参考时期线对皆事件的才调,即高CI值的问题更有可能指引检索到与标的新闻事件磋议的著述,用检索生成的时期线和参考时期线中包含日历的F1分数进行量度。
基于最大化问题集时序信息量的标的,彩娱乐app构建一个“新闻-问题”的示例池,用于率领新标的新闻的问题生成。
对于每个新的标的新闻,通过余弦相似性动态检索与标的新闻最相似的样本,确保了样本的荆棘文磋议性和时期信息的准确性。
3.3 迭代发问
CHRONOS通过一语气迭代发问,迟缓深入探索事件的细节。
每一轮迭代都基于前一轮的检索戒指,以发现新的问题和信息,直到兴盛时期线中事件数目或达到最大迭代次数。
3.4 问题改写
查询改写(Query Rewriting)是检索增强生成中常用的优化行为。
在CHRONOS框架中,团队通过对入手发问阶段产生的平日或复杂问题改写为2-3个更易于检索的子问题,概况生成更具体、更有针对性的查询,从而提高搜索引擎的检索后果。
他们通常在辅导中加入极少样本,率领大模子进行有用改写,将复杂问题滚动为更具体的查询,同期保执问题的原始意图。
3.5 时期线生成
CHRONOS通过两阶段生成完好的时期线追思:生成(Generation)和归并(Merging)。
生成:通过分析每一轮检索到的新闻著述来识别要道事件和详备信息。运用大模子的线路和生成才调,索要每个事件的发诞辰期和磋议细节,并为每个事件撰写浅近的款式。这些事件和款式被组织成初步的时期线,按照时期划定陈设,为后续的归并阶段提供基础。
归并:将多轮检索生成的初步时期线整合成一个连贯的最终摘要。这依然过触及对皆不同时间线中的事件、措置任何日历或款式上的突破,并聘任最具代表性和进犯性的事件。
全新数据集OPEN-TLS
为了评估TLS系统,探究团队还网罗了由专科记者撰写的对于近期新闻事件的时期线,构建了一个名为Open-TLS的新数据集。
与以往禁闭域的数据集比拟,Open-TLS不仅在数据集范围和内容上愈加种种化,消释政事、经济、社会、体育和科学技艺等多个边界,并且在时效性上更具上风,为通达域TLS任务提供了一个更全面和更具挑战性的基准。
实验戒指
1. 实验设定
实验基于GPT-3.5-Turbo、GPT-4和Qwen2.5-72B分辩构建CHRONOS系统,评测通达域和禁闭域两个设定下TLS的性能推崇。使用的评估主张主要有:
ROUGE-N: 量度生成时期线和参考时期线之间的N-gram访佛。具体包括:(1)Concat F1:通过将通盘日历摘要齐集起来探究ROUGE,以评估举座的一致性;(2)Agree F1:仅使用匹配日历的摘要探究ROUGE,以评估特定日历的准确性;(3)Align F1:在探究ROUGE之前,先凭证相似性和日历接近性对预计摘要和参考摘要进行对皆,评估对皆后的一致性。
Date F1:量度生成时期线中日历与参考时期线中信得过日历匹配进度。
2. 通达域TLS
在通达域TLS的实验中,CHRONOS与几个基线行为进行了比较,包括径直搜索标的新闻(DIRECT)和重写标的新闻以创建查询用于检索(REWRITE)。
拖更的Sora终于发布了,悬着的心也终于可以死了。
对比之下,CHRONOS通过迭代自我发问和检索磋议新闻著述的行为,显赫提高了事件追思的质料和日历对皆的准确性,在通盘主张上都越过于基线行为。
3. 禁闭域TLS
在禁闭域TLS的实验中,CHRONOS与之前的代表性使命进行了比较,包括:(1)基于事件团聚行为的CLUST (Gholipour Ghalandari and. Ifrim, 2020);(2)基于事件图模子EGC(Li et al., 2021)和(3)运用大模子进行事件聚类的LLM-TLS(Hu et al., 2024)。
在Crisis和T17这两个经典数据集上的比较戒指深远,CHRONOS达到了与这些使命类似的推崇,在两个数据集的AR-2主张上获取了SOTA后果,评释了其在不同类型事件和时期跨度上的弘大性能和适合性。
4. 运行时期分析
CHRONOS的另一个上风体目下着力方面。
与通常基于大模子、但需要处理新闻库中通盘著述的LLM-TLS行为比拟,它通过检索增强机制专注于最磋议的新闻著述,显赫减少了处理时期。
这种着力的进步使其在现实应用中更为实用,尤其是在需要快速反应的场景中。
案例探究:苹果居品发布时期线
团队深入分析了模子在处理具体新闻事件时的推崇,通过聘任具有代表性的新闻事件,如苹果公司的紧要居品发布,概况不雅察到CHRONOS怎么通过轮回渐进的自我发问和信息检索来生成时期线。
在案例探究中,CHRONOS展示了其概况准确索要要道事件和日历的才调,同期也揭示了在某些情况下可能需要校正的所在,举例对某些事件的遗漏或日历幻觉。
结语
CHRONOS框架通过衔尾大型言语模子的迭代自我发问和检索增强生成技艺,为时期线追思任务提供了一种新颖且有用的措置决策。
这种行为的中枢在于模拟东谈主类的信息检索经过,通过抑制地冷漠和复兴新问题来迟缓深入线路事件,最毕生成一个全面且连贯的时期线摘要。
实验戒指已经充分评释了CHRONOS在复杂事件检索和构建时期线方面的才调,展示了该框架在现实新闻时期线生成应用中的应用后劲和准确性。
同期,这种迭代发问的检索生成行为是否具有泛化到通用任务上的才调也值得翌日进一步探究。
Reference:
[1] Demian Gholipour Ghalandari and Georgiana Ifrim. 2020. Examining the state-of-the-art in news timeline summarization. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 1322–1334, Online. Association for Computational Linguistics.
[2] Manling Li, Tengfei Ma, Mo Yu, Lingfei Wu, Tian Gao, Heng Ji, and Kathleen McKeown. 2021. Timeline summarization based on event graph compression via time-aware optimal transport. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 6443–6456, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.
[3] Qisheng Hu, Geonsik Moon, and Hwee Tou Ng. 2024. From moments to milestones: Incremental timeline summarization leveraging large language models. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 7232–7246, Bangkok, Thailand. Association for Computational Linguistics.
— 完 —彩娱乐