彩娱乐

彩娱乐登陆网址 用大模子吃瓜更智能了!阿里通义实验室刻薄新时候线追思框架,全面提高新闻追思效用

发布日期:2025-01-07 18:59    点击次数:182

敞开域和禁闭域TLS都更高效了

目下彩娱乐登陆网址,大模子不错帮你梳理新闻时候线了,以后吃瓜就更省略了!

AI Agent的风,我们赛博乐子东说念主也得吹吹。

这即是来自阿里巴巴通义实验室与上海交通大学的新商讨,他们刻薄了一种基于Agent的新闻时候线节录新框架——CHRONOS。

它不仅不错帮你从海量新闻中追思出伏击事件,更伏击的是,它还不错梳理出明晰的时候线,以后上网冲浪时各式复杂事件都一目了然。

其中的CHRONOS一词取自希腊据说中的时候之神柯罗诺斯。

该框架通过迭代多轮的自我发问款式,勾搭检索增强生成时间,从互联网上检索相关事件信息,并生成时候递次的新闻节录,为新闻时候线节录生成提供了一种全新的责罚决策。

先来全部瞅瞅几个例子。

比如对于新闻“国足1-0巴林”,CHRONOS好像追思海量新闻,呈现事件的一脉相传。

对于掩饰时候更长的新闻“中国探月工程”,CHRONOS也能聚焦要点事件,呈刻下候线发展,使得用户好像一目了然。

补皆敞开域TLS短板

时候线追思(Timeline Summarization, TLS)任务是一种当然言语处理界限的经典时间挑战,它旨在从大都文本数据中索要要津事件,并如时间递次罗列,以提供对某一主题或界限历史发展的结构化视图。

举例,在新闻界限,时候线追思不错匡助用户快速了解一个新闻事件的一脉相传。该任务不仅条目识别出伏击的事件,还需模范路事件之间的时候关系和因果谋划,以便生成一个连贯、浮浅且信息丰富的时候线节录。

证据可检索事件的着手,不错将TLS任务细分为禁闭域(closed-domain)和敞开域(open-domain)两个设定:在禁闭域TLS任务中,时候线是从一组预界说的、与特定主题或界限相关的新闻著述中创建的,而敞开域TLS指的是从互联网上径直搜索和检索新闻著述来生成时候线的经由。

当年的责任东要聚积于责罚禁闭域上时候线生成问题,而敞开域TLS则需要纷乱的信息检索和筛选才智,以及在莫得全局视图的情况下识别和建筑事件之间谋划的才智,为这项任务刻薄了新的要乞降挑战。

迭代检索的CHRONOS框架

为了应酬上述挑战,团队刻薄CHRONOS框架,通过迭代发问进行相关事件检索,生成准确、全面的时候线节录,好像灵验地责罚敞开域和禁闭域两种设定下的TLS任务。

1. 动机

时候线生成的中枢在于建筑事件之间的时候和因果关系。

每个新闻事件都不错被暗示为一个不同的节点,任务的方向是建筑这些节点之间的边,以展示它们的相关性,并最终造成一个异构图,从主题新闻的节点入手。

因此,通过一个检索机制来检索相关的新闻著述,不错灵验建筑这些边,造成事件之间的谋划。

2. 空洞

CHRONOS欺骗大模子的才智,通过模拟东说念主类信息检索的经由,即通过刻薄问题、基于检索截止进一步刻薄新的问题,最终网罗对于相关事件的全面信息并追思为时候线。

CHRONOS包括以下几个模块:

自我发问 (Self-Questioning):当先搜索粗粒度的新闻布景信息彩娱乐登陆网址,然后迭代地刻薄问题,以检索更多相关新闻。

问题改写 (Question Rewriting):将复杂或进展欠安的问题阐发为更具体、更易检索的查询。

时候线生成 (Timeline Generation):通过湮灭每一轮检索生成的时候线走动顾一个杰出伏击事件的时候线。

3. 自我发问3.1 粗粒度布景调研

在自我发问的启动阶段,CHRONOS使用方向新闻的标题四肢要津词进行搜索,以网罗与方向新闻最径直相关的信息。

这些信息组成了新闻布景(News Context),为自我发问打下初步基础。

3.2 发问示例秉承

在粗粒度布景调研之后,CHRONOS欺骗大模子的凹凸体裁习才智,通过少许样本指示来率领模子生成对于方向新闻的问题。

为了评估问题样骨子量,引入了时序信息量(Chrono-Informativeness, CI)的见识,用来谈判模子刻薄的问题检索与参考时候线对皆事件的才智,即高CI值的问题更有可能开采检索到与方向新闻事件相关的著述,用检索生成的时候线和参考时候线中包含日历的F1分数进行谈判。

基于最大化问题集时序信息量的方向,构建一个“新闻-问题”的示例池,用于率领新方向新闻的问题生成。

对于每个新的方向新闻,通过余弦相似性动态检索与方向新闻最相似的样本,彩娱乐注册CLY588.VIP确保了样本的凹凸文相关性和时候信息的准确性。

3.3 迭代发问

CHRONOS通过一语气迭代发问,逐渐深刻探索事件的细节。

每一轮迭代都基于前一轮的检索截止,以发现新的问题和信息,直到悠闲时候线中事件数目或达到最大迭代次数。

3.4 问题改写

查询改写(Query Rewriting)是检索增强生成中常用的优化法子。

在CHRONOS框架中,团队通过对启动发问阶段产生的往常或复杂问题改写为2-3个更易于检索的子问题,好像生成更具体、更有针对性的查询,从而提高搜索引擎的检索截止。

他们相通在指示中加入少许样本,率领大模子进行灵验改写,将复杂问题调度为更具体的查询,同期保捏问题的原始意图。

3.5 时候线生成

CHRONOS通过两阶段生成完好的时候线追思:生成(Generation)和湮灭(Merging)。

生成:通过分析每一轮检索到的新闻著述来识别要津事件和详备信息。欺骗大模子的通晓和生成才智,索要每个事件的发诞辰期和相关细节,并为每个事件撰写浮浅的面貌。这些事件和面貌被组织成初步的时候线,按照时候递次罗列,为后续的湮灭阶段提供基础。

湮灭:将多轮检索生成的初步时候线整合成一个连贯的最终节录。这仍是由波及对皆不同时间线中的事件、责罚任何日历或面貌上的打破,并秉承最具代表性和伏击性的事件。

全新数据集OPEN-TLS

为了评估TLS系统,商讨团队还网罗了由专科记者撰写的对于近期新闻事件的时候线,构建了一个名为Open-TLS的新数据集。

与以往禁闭域的数据集比拟,Open-TLS不仅在数据集限度和内容上愈加种种化,掩饰政事、经济、社会、体育和科学时间等多个界限,何况在时效性上更具上风,为敞开域TLS任务提供了一个更全面和更具挑战性的基准。

实验截止

1. 实验设定

实验基于GPT-3.5-Turbo、GPT-4和Qwen2.5-72B区分构建CHRONOS系统,评测敞开域和禁闭域两个设定下TLS的性能进展。使用的评估想象主要有:

ROUGE-N: 谈判生成时候线和参考时候线之间的N-gram重复。具体包括:(1)Concat F1:通过将通盘日历节录皆集起来计较ROUGE,以评估合座的一致性;(2)Agree F1:仅使用匹配日历的节录计较ROUGE,以评估特定日历的准确性;(3)Align F1:在计较ROUGE之前,先证据相似性和日历接近性对臆度节录和参考节录进行对皆,评估对皆后的一致性。

Date F1:谈判生成时候线中日历与参考时候线中果真日历匹配进程。

2. 敞开域TLS

在敞开域TLS的实验中,CHRONOS与几个基线法子进行了比较,包括径直搜索方向新闻(DIRECT)和重写方向新闻以创建查询用于检索(REWRITE)。

对比之下,CHRONOS通过迭代自我发问和检索相关新闻著述的法子,权贵提高了事件追思的质料和日历对皆的准确性,在通盘想象上都特等于基线法子。

3. 禁闭域TLS

在禁闭域TLS的实验中,CHRONOS与之前的代表性责任进行了比较,包括:(1)基于事件团员法子的CLUST (Gholipour Ghalandari and. Ifrim, 2020);(2)基于事件图模子EGC(Li et al., 2021)和(3)欺骗大模子进行事件聚类的LLM-TLS(Hu et al., 2024)。

在Crisis和T17这两个经典数据集上的比较截止清楚,CHRONOS达到了与这些责任访佛的进展,在两个数据集的AR-2想象上得回了SOTA截止,解说了其在不同类型事件和时候跨度上的纷乱性能和合乎性。

4. 运行时候分析

CHRONOS的另一个上风体目下效用方面。

与相通基于大模子、但需要处理新闻库中通盘著述的LLM-TLS法子比拟,它通过检索增强机制专注于最相关的新闻著述,权贵减少了处理时候。

这种效用的提高使其在履行应用中更为实用,尤其是在需要快速反应的场景中。

然而,理想与现实之间总是存在着不少的差距。在经过两年时间研发后,苹果公司近期决定终止这一项目。由于监管问题、软件漏洞以及其他技术障碍,苹果无法确保服务的稳定性和安全性,最终不得不做出放弃的决定。目前负责开发该服务的团队已经解散,并重新分配到公司的其他项目中。

在9月份之前的很长一段时间,深圳楼市属于纯粹的买方市场,哪怕是核心资产也会被悲观情绪乱杀。

案例商讨:苹果产物发布时候线

团队深刻分析了模子在处理具体新闻事件时的进展,通过秉承具有代表性的新闻事件,如苹果公司的紧要产物发布,好像不雅察到CHRONOS若何通过轮回渐进的自我发问和信息检索来生成时候线。

在案例商讨中,CHRONOS展示了其好像准确索要要津事件和日历的才智,同期也揭示了在某些情况下可能需要改革的所在,举例对某些事件的遗漏或日历幻觉。

结语

CHRONOS框架通过勾搭大型言语模子的迭代自我发问和检索增强生成时间,为时候线追思任务提供了一种新颖且灵验的责罚决策。

这种法子的中枢在于模拟东说念主类的信息检索经由,通过不停地刻薄和回应新问题来逐渐深刻通晓事件,最毕生成一个全面且连贯的时候线节录。

实验截止已经充阐发说了CHRONOS在复杂事件检索和构建时候线方面的才智,展示了该框架在履行新闻时候线生成应用中的应用后劲和准确性。

同期,这种迭代发问的检索生成法子是否具有泛化到通用任务上的才智也值得畴昔进一步商讨。

Reference:

[1] Demian Gholipour Ghalandari and Georgiana Ifrim. 2020. Examining the state-of-the-art in news timeline summarization. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 1322–1334, Online. Association for Computational Linguistics.

[2] Manling Li, Tengfei Ma, Mo Yu, Lingfei Wu, Tian Gao, Heng Ji, and Kathleen McKeown. 2021. Timeline summarization based on event graph compression via time-aware optimal transport. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 6443–6456, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.

[3] Qisheng Hu, Geonsik Moon, and Hwee Tou Ng. 2024. From moments to milestones: Incremental timeline summarization leveraging large language models. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 7232–7246, Bangkok, Thailand. Association for Computational Linguistics.

— 完 —彩娱乐登陆网址



 




Powered by 彩娱乐 @2013-2022 RSS地图 HTML地图