当今,大模子不错帮你梳理新闻时辰线了,以后吃瓜就更便捷了!
AI Agent的风,我们赛博乐子东谈主也得吹吹。
这等于来自阿里巴巴通义实验室与上海交通大学的新参谋,他们提议了一种基于Agent的新闻时辰线节录新框架——CHRONOS。
它不仅不错帮你从海量新闻中回顾出要紧事件,更要紧的是,它还不错梳理出显着的时辰线,以后上网冲浪时千般复杂事件都一目了然。
其中的CHRONOS一词取自希腊传闻中的时辰之神柯罗诺斯。
该框架通过迭代多轮的自我发问模式,结合检索增强生成本领,从互联网上检索关联事件信息,并生成时辰法则的新闻节录,为新闻时辰线节录生成提供了一种全新的处置决策。
先来一齐瞅瞅几个例子。
比如对于新闻“国足1-0巴林”,CHRONOS大约回顾海量新闻,呈现事件的一脉相通。
对于袒护时辰更长的新闻“中国探月工程”,CHRONOS也能聚焦重苦衷件,呈刻下辰线发展,使得用户大约一目了然。
补都盛开域TLS短板
时辰线回顾(Timeline Summarization, TLS)任务是一种当然谈话处理领域的经典本领挑战,它旨在从浩荡文本数据中提真金不怕火重要事件,并如时间法则罗列,以提供对某一主题或领域历史发展的结构化视图。
举例,在新闻领域,时辰线回顾不错匡助用户快速了解一个新闻事件的一脉相通。该任务不仅条目识别出要紧的事件,还需要聚积事件之间的时辰商量和因果商量,以便生成一个连贯、简陋且信息丰富的时辰线节录。
把柄可检索事件的开头,不错将TLS任务细分为禁闭域(closed-domain)和盛开域(open-domain)两个设定:在禁闭域TLS任务中,时辰线是从一组预界说的、与特定主题或领域关联的新闻著述中创建的,而盛开域TLS指的是从互联网上平直搜索和检索新闻著述来生成时辰线的流程。
昔日的职责东要围聚于处置禁闭域上时辰线生成问题,而盛开域TLS则需要纷乱的信息检索和筛选智力,以及在莫得全局视图的情况下识别和建树事件之间商量的智力,为这项任务提议了新的要乞降挑战。
迭代检索的CHRONOS框架
为了应答上述挑战,团队提议CHRONOS框架,通过迭代发问进行关联事件检索,生成准确、全面的时辰线节录,大约有用地处置盛开域和禁闭域两种设定下的TLS任务。
1. 动机
时辰线生成的中枢在于建树事件之间的时辰和因果商量。
每个新闻事件都不错被默示为一个不同的节点,任务的标的是建树这些节点之间的边,以展示它们的关联性,并最终酿成一个异构图,从主题新闻的节点起先。
因此,通过一个检索机制来检索关联的新闻著述,不错有用建树这些边,酿成事件之间的商量。
2. 综合
CHRONOS诳骗大模子的智力,通过模拟东谈主类信息检索的流程,即通过提议问题、基于检索适度进一步提议新的问题,最终网罗对于关联事件的全面信息并回顾为时辰线。
CHRONOS包括以下几个模块:
自我发问 (Self-Questioning):领先搜索粗粒度的新闻布景信息,然后迭代地提议问题,以检索更多关联新闻。
问题改写 (Question Rewriting):将复杂或推崇欠安的问题剖判为更具体、更易检索的查询。
时辰线生成 (Timeline Generation):通过并吞每一轮检索生成的时辰线往复首一个隆起要紧事件的时辰线。
3. 自我发问3.1 粗粒度布景调研
在自我发问的运行阶段,CHRONOS使用标的新闻的标题行动重要词进行搜索,以网罗与标的新闻最平直关联的信息。
这些信息组成了新闻布景(News Context),为自我发问打下初步基础。
3.2 发问示例聘用
在粗粒度布景调研之后,CHRONOS诳骗大模子的险峻体裁习智力,通过极少样本请示来带领模子生成对于标的新闻的问题。
为了评估问题样实质料,引入了时序信息量(Chrono-Informativeness, CI)的认识,用来掂量模子提议的问题检索与参考时辰线对都事件的智力,即高CI值的问题更有可能交流检索到与标的新闻事件关联的著述,用检索生成的时辰线和参考时辰线中包含日历的F1分数进行掂量。
基于最大化问题集时序信息量的标的,构建一个“新闻-问题”的示例池,用于带领新标的新闻的问题生成。
对于每个新的标的新闻,通过余弦相似性动态检索与标的新闻最相似的样本,彩娱乐确保了样本的险峻文关联性和时辰信息的准确性。
3.3 迭代发问
CHRONOS通过连气儿迭代发问,迟缓久了探索事件的细节。
每一轮迭代都基于前一轮的检索适度,以发现新的问题和信息,直到知足时辰线中事件数目或达到最大迭代次数。
3.4 问题改写
查询改写(Query Rewriting)是检索增强生成中常用的优化体式。
在CHRONOS框架中,团队通过对运行发问阶段产生的平日或复杂问题改写为2-3个更易于检索的子问题,大约生成更具体、更有针对性的查询,从而提高搜索引擎的检索遵守。
他们相同在请示中加入极少样本,带领大模子进行有用改写,将复杂问题转念为更具体的查询,同期保抓问题的原始意图。
3.5 时辰线生成
CHRONOS通过两阶段生成完满的时辰线回顾:生成(Generation)和并吞(Merging)。
没错,但是当国米和那不勒斯11连胜时,他们已经在积分榜孤独领跑。今年有很多球队挤在了一起,这让联赛变得扣人心弦。我们希望2025年可以像2024年一样精彩。但我们必须首先维持这种精神状态。
“当他去巴黎圣日耳曼时,那是他的梦想、他的想法、他的决定。他决定改变,但为什么呢?当时,这有点奇怪,我们和巴塞罗那的情况很困难,因为我们并不真正知道董事会的想法。”
生成:通过分析每一轮检索到的新闻著述来识别重要事件和细心信息。诳骗大模子的聚积和生成智力,提真金不怕火每个事件的发寿辰期和关联细节,并为每个事件撰写简陋的刻画。这些事件和刻画被组织成初步的时辰线,按照时辰法则罗列,为后续的并吞阶段提供基础。
并吞:将多轮检索生成的初步时辰线整合成一个连贯的最终节录。这一流程触及对都不同时间线中的事件、处置任何日历或刻画上的冲破,并聘用最具代表性和要紧性的事件。
全新数据集OPEN-TLS
为了评估TLS系统,参谋团队还网罗了由专科记者撰写的对于近期新闻事件的时辰线,构建了一个名为Open-TLS的新数据集。
与以往禁闭域的数据集比较,Open-TLS不仅在数据集界限和内容上愈加千般化,袒护政事、经济、社会、体育和科学本领等多个领域,何况在时效性上更具上风,为盛开域TLS任务提供了一个更全面和更具挑战性的基准。
实验适度
1. 实验设定
实验基于GPT-3.5-Turbo、GPT-4和Qwen2.5-72B隔离构建CHRONOS系统,评测盛开域和禁闭域两个设定下TLS的性能推崇。使用的评估标的主要有:
ROUGE-N: 掂量生成时辰线和参考时辰线之间的N-gram重复。具体包括:(1)Concat F1:通过将所有这个词日历节录勾通起来蓄意ROUGE,以评估举座的一致性;(2)Agree F1:仅使用匹配日历的节录蓄意ROUGE,以评估特定日历的准确性;(3)Align F1:在蓄意ROUGE之前,先把柄相似性和日历接近性对忖度节录和参考节录进行对都,评估对都后的一致性。
Date F1:掂量生成时辰线中日历与参考时辰线中信得过日历匹配进度。
2. 盛开域TLS
在盛开域TLS的实验中,CHRONOS与几个基线体式进行了比较,包括平直搜索标的新闻(DIRECT)和重写标的新闻以创建查询用于检索(REWRITE)。
对比之下,CHRONOS通过迭代自我发问和检索关联新闻著述的体式,权臣提高了事件回顾的质料和日历对都的准确性,在所有这个词标的上都逾越于基线体式。
3. 禁闭域TLS
在禁闭域TLS的实验中,CHRONOS与之前的代表性职责进行了比较,包括:(1)基于事件团聚体式的CLUST (Gholipour Ghalandari and. Ifrim, 2020);(2)基于事件图模子EGC(Li et al., 2021)和(3)诳骗大模子进行事件聚类的LLM-TLS(Hu et al., 2024)。
在Crisis和T17这两个经典数据集上的比较适度走漏,CHRONOS达到了与这些职责访佛的推崇,在两个数据集的AR-2标的上得回了SOTA遵守,解释了其在不同类型事件和时辰跨度上的纷乱性能和稳健性。
4. 运行时辰分析
CHRONOS的另一个上风体当今遵守方面。
与相同基于大模子、但需要处理新闻库中所有这个词著述的LLM-TLS体式比较,它通过检索增强机制专注于最关联的新闻著述,权臣减少了处理时辰。
这种遵守的进步使其在实践应用中更为实用,尤其是在需要快速反映的场景中。
案例参谋:苹果居品发布时辰线
团队久了分析了模子在处理具体新闻事件时的推崇,通过聘用具有代表性的新闻事件,如苹果公司的首要居品发布,大约不雅察到CHRONOS若何通过行远自迩的自我发问和信息检索来生成时辰线。
在案例参谋中,CHRONOS展示了其大约准确提真金不怕火重要事件和日历的智力,同期也揭示了在某些情况下可能需要雠校的所在,举例对某些事件的遗漏或日历幻觉。
结语
CHRONOS框架通过结合大型谈话模子的迭代自我发问和检索增强生成本领,为时辰线回顾任务提供了一种新颖且有用的处置决策。
这种体式的中枢在于模拟东谈主类的信息检索流程,通过不停地提议和回话新问题来迟缓久了聚积事件,最终身成一个全面且连贯的时辰线节录。
实验适度照旧充剖判释了CHRONOS在复杂事件检索和构建时辰线方面的智力,展示了该框架在实践新闻时辰线生成应用中的应用后劲和准确性。
同期,这种迭代发问的检索生成体式是否具有泛化到通用任务上的智力也值得将来进一步参谋。
Reference:
[1] Demian Gholipour Ghalandari and Georgiana Ifrim. 2020. Examining the state-of-the-art in news timeline summarization. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 1322–1334, Online. Association for Computational Linguistics.
[2] Manling Li, Tengfei Ma, Mo Yu, Lingfei Wu, Tian Gao, Heng Ji, and Kathleen McKeown. 2021. Timeline summarization based on event graph compression via time-aware optimal transport. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 6443–6456, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.
[3] Qisheng Hu, Geonsik Moon, and Hwee Tou Ng. 2024. From moments to milestones: Incremental timeline summarization leveraging large language models. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 7232–7246, Bangkok, Thailand. Association for Computational Linguistics.
— 完 —彩娱乐合作加盟飞机号@yy12395