博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
论文笔记 | An End-to-End Deep Framework for Answer Triggering with a Novel Group-Level Objective
阅读量:4290 次
发布时间:2019-05-27

本文共 1627 字,大约阅读时间需要 5 分钟。

作者:李瑾

单位:燕山大学


论文地址:

代码地址:


目录

  1. 研究背景
  2. 研究方法
    2.1 模型框架
    2.2 组级目标函数
  3. 实验与评估
    3.1 数据集
    3.2 实验结果
  4. 总结

1. 研究背景

在现实生活和实际的问答中,并不是所有的问题都存在有效的可以充分支持所提出的问题的候选答案,因此在2015年WiKiQA数据集发布的同时首次提出了答案触发这一任务。

答案触发任务可以划分为两个子任务:一是构建模型对候选答案排序,使得正确答案获得最高的分数;二是对候选答案中是否存在正确答案作出预测。

先前工作通过pipline的方法来解决这一问题,但得到的模型并不能令人满意,F1值仅仅在32%到36%之间。本文提出了端到端的深度应答触发框架。

2. 研究方法

本文提出了使用端到端的深度模型框架并提出了新的目标函数惩罚答案触发中存在

2.1 模型框架

模型由三个部分组成:编码层、问答匹配层和最大池化层。

其中:

  • 编码层可以根据所要达成的目标使用不同的网络框架
  • 问答匹配层将问题与候选答案拼接喂入前向神经网络
  • 在max pooling 层作者将同一答案的候选集中预测标签为正和负的答案划分为互不相交的两个子集

2.2 组级目标函数

作者提出了新的目标函数惩罚机制来促使模型作出正确的选择。

  • 对于每个预测标签为负的样本集,最高分数的错误答案将受到铰链惩罚(hinge loss)。公式如下:
    O 1 = 1 N n e g ∑ i : l i = 0 m a x ( 0 , d − − ( 0.5 − m i − ) ) O_{1}=\frac{1}{N_{neg}}\sum_{i:l_{i}=0}^{}max(0,d^{-}-(0.5 - m_{i}^{-})) O1=Nneg1i:li=0max(0,d(0.5mi))
  • O2用于惩罚在一组正确答案中得分最高的分数不足以表示答案存在的情况。公式如下:
    O 2 = 1 N p o s ∑ i : l i = 1 m a x ( 0 , d + − ( m i + − 0.5 ) ) O_{2}=\frac{1}{N_{pos}}\sum_{i:l_{i}=1}^{}max(0,d^{+}-(m_{i}^{+} - 0.5)) O2=Npos1i:li=1max(0,d+(mi+0.5))
  • O3是对错误的候选答案获得最高分的情况进行处罚。公式如下:
    O 3 = 1 N p o s ∑ i : l i = 1 m a x ( 0 , d ± − ( m i + − m i − ) ) O_{3}=\frac{1}{N_{pos}}\sum_{i:l_{i}=1}^{}max(0,d^{\pm }-(m_{i}^{+} -m_{i}^{-} )) O3=Npos1i:li=1max(0,d±(mi+mi))
  • 整体公式如下:
    O = O 1 + α O 2 + β O 3 + λ ∥ θ ∥ 2 O = O_{1} + \alpha O_{2} + \beta O_{3} + \lambda \left \| \theta \right \|^{2} O=O1+αO2+βO3+λθ2

其中, m i + m_{i}^{+} mi+是预测标签为正的候选答案中的最大分数, m i − m_{i}^{-} mi是错误答案中的最高分数。 d + d^{+} d+ d − d^{-} d d ± d^{\pm } d±是距离超参数。

3. 实验与评估

3.1 数据集

实验采用WiKiQA数据集,数据集信息如下:

3.2 实验结果

消融实验

总结

  • 提出了使用基于深度神经网络的端到端框架来解决答案触发问题
  • 提出了新的组级目标函数来优化整个框架。目标函数明确惩罚了答案触发中的三个潜在错误:
    (1)假阳性
    (2)假阴性预测是否存在正确答案
    (3)错误答案的排名高于正确答案

转载地址:http://sqmgi.baihongyu.com/

你可能感兴趣的文章
解决elasticsearch7.3版本安装过程中遇到的包括内存不够、线程不够等问题
查看>>
日常项目测试用例检查点(来自一线测试人员的吐血总结)
查看>>
网站建设之域名注册和域名备案
查看>>
解决bootstrap时间输入框总被浏览器记住的记录遮挡住的问题
查看>>
git将一个分支完全覆盖另外一个分支如:dev分支代码完全覆盖某一个开发分支
查看>>
elasticsearch7.3版本环境搭建(二)可视化管理后台kibana的安装和配置
查看>>
elasticsearch7.3版本环境搭建(三)可视化管理后台kibana的汉化(设置中文界面)
查看>>
记录一次DDos攻击实战
查看>>
分享一首小诗--《致程序员》
查看>>
为什么百度只抓取了首页而不抓取我的网站的内页的原因分析
查看>>
年薪170万的阿里P8级员工征婚有感--话说阿里真有钱,这员工要求的条件真多
查看>>
又是一年桂花飘香时,祝我们伟大的祖国70年华诞更加繁荣昌盛,祝大家国庆节快乐
查看>>
谷歌浏览器chrome即将在2020年底停止支持flash,我们程序员该怎么办
查看>>
如何将数据采集到 Elasticsearch 服务
查看>>
面试官:mysql表设计要注意什么?
查看>>
一些精致小众网站收集录
查看>>
计算机科学探秘之linux发展史
查看>>
程序员每天早上早来10分钟的好处
查看>>
互联网30年,泡沫如梦,一个个泡沫和风口过后,会是什么样的结局
查看>>
升级centos 6.8 服务器的gcc
查看>>