[2022-01-20] 오늘의 자연어처리

2022. 1. 20. 10:30paper-of-the-day

반응형

 

Syntax-based data augmentation for Hungarian-English machine translation

 

We train Transformer-based neural machine translation models for Hungarian-English and English-Hungarian using the Hunglish2 corpus. Our best models achieve a BLEU score of 40.0 on HungarianEnglish and 33.4 on English-Hungarian. Furthermore, we present results on an ongoing work about syntax-based augmentation for neural machine translation. Both our code and models are publicly available.

 

우리는 트랜스포머 기반 신경 기계 번역 모델을 훈련한다. Hunglish2 말뭉치를 사용하는 헝가리-영어 및 영어-헝가리어. 우리 베스트 모델들은 헝가리 영어에서 40.0의 BLEU 점수와 33.4의 점수를 획득한다. 영어-헝가리어의 또한, 우리는 다음에 대한 진행 중인 작업에 대한 결과를 제시한다. 신경 기계 번역을 위한 구문 기반 증강. 우리의 코드와 모델을 공개적으로 사용할 수 있습니다. 

 

 

Mining Fine-grained Semantics via Graph Neural Networks for Evidence-based Fake News Detection

 

The prevalence and perniciousness of fake news has been a critical issue on the Internet, which stimulates the development of automatic fake news detection in turn. In this paper, we focus on the evidence-based fake news detection, where several evidences are utilized to probe the veracity of news (i.e., a claim). Most previous methods first employ sequential models to embed the semantic information and then capture the claim-evidence interaction based on different attention mechanisms. Despite their effectiveness, they still suffer from two main weaknesses. Firstly, due to the inherent drawbacks of sequential models, they fail to integrate the relevant information that is scattered far apart in evidences for veracity checking. Secondly, they neglect much redundant information contained in evidences that may be useless or even harmful. To solve these problems, we propose a unified Graph-based sEmantic sTructure mining framework, namely GET in short. Specifically, different from the existing work that treats claims and evidences as sequences, we model them as graph-structured data and capture the long-distance semantic dependency among dispersed relevant snippets via neighborhood propagation. After obtaining contextual semantic information, our model reduces information redundancy by performing graph structure learning. Finally, the fine-grained semantic representations are fed into the downstream claim-evidence interaction module for predictions. Comprehensive experiments have demonstrated the superiority of GET over the state-of-the-arts.

 

가짜 뉴스의 만연과 유해성은 중요한 이슈였다. 가짜뉴스 자동탐지의 발전을 촉진하는 인터넷 결국. 이 논문에서 우리는 증거 기반의 가짜 뉴스 탐지에 초점을 맞춘다. 여기서 뉴스의 진실성을 조사하기 위해 몇 가지 증거가 사용된다. claim) 대부분의 이전 방법들은 먼저 순차적 모델을 사용하여 다음을 포함시킨다. 의미 정보, 그리고 나서 클레임-매개 상호 작용을 캡처합니다. 다른 주의 메커니즘. 그들의 효과에도 불구하고, 그들은 여전히 고통받고 있다. 두 가지 주요 약점으로부터. 첫째, 순차적 단점 때문에 모델은 멀리 흩어져 있는 관련 정보를 통합하지 못합니다. 진실성 확인을 위한 증거들은 차치하고요 둘째로, 그들은 많은 중복을 무시한다. 쓸모없거나 심지어 해로울 수 있는 증거에 포함된 정보 로. 이러한 문제를 해결하고, 우리는 통일된 그래프 기반 sEmantic sTruxure를 제안한다. 즉, GET 프레임워크입니다. 특히, 와는 다르다. 주장과 증거를 시퀀스로 취급하는 기존 작업, 우리는 그것들을 모델링합니다. 그래프 구조화된 데이터와 사이의 장거리 의미 의존성을 포착한다. 주변 전파를 통해 관련 스니펫을 분산시킵니다. 얻은 후 문맥적 의미 정보, 우리의 모델은 정보 중복을 줄인다. 그래프 구조 학습을 수행합니다. 마지막으로, 세밀한 의미론 표현은 다운스트림 클레임-매개 상호 작용 모듈에 입력된다. 예언을 위해서요 포괄적인 실험을 통해 의 우수성이 입증되었습니다. 최첨단 기술을 극복하십시오. 

 

 

Mining Fine-grained Semantics via Graph Neural Networks for Evidence-based Fake News Detection

 

The prevalence and perniciousness of fake news has been a critical issue on the Internet, which stimulates the development of automatic fake news detection in turn. In this paper, we focus on the evidence-based fake news detection, where several evidences are utilized to probe the veracity of news (i.e., a claim). Most previous methods first employ sequential models to embed the semantic information and then capture the claim-evidence interaction based on different attention mechanisms. Despite their effectiveness, they still suffer from two main weaknesses. Firstly, due to the inherent drawbacks of sequential models, they fail to integrate the relevant information that is scattered far apart in evidences for veracity checking. Secondly, they neglect much redundant information contained in evidences that may be useless or even harmful. To solve these problems, we propose a unified Graph-based sEmantic sTructure mining framework, namely GET in short. Specifically, different from the existing work that treats claims and evidences as sequences, we model them as graph-structured data and capture the long-distance semantic dependency among dispersed relevant snippets via neighborhood propagation. After obtaining contextual semantic information, our model reduces information redundancy by performing graph structure learning. Finally, the fine-grained semantic representations are fed into the downstream claim-evidence interaction module for predictions. Comprehensive experiments have demonstrated the superiority of GET over the state-of-the-arts.

 

가짜 뉴스의 만연과 유해성은 중요한 이슈였다. 가짜뉴스 자동탐지의 발전을 촉진하는 인터넷 결국. 이 논문에서 우리는 증거 기반의 가짜 뉴스 탐지에 초점을 맞춘다. 여기서 뉴스의 진실성을 조사하기 위해 몇 가지 증거가 사용된다. claim) 대부분의 이전 방법들은 먼저 순차적 모델을 사용하여 다음을 포함시킨다. 의미 정보, 그리고 나서 클레임-매개 상호 작용을 캡처합니다. 다른 주의 메커니즘. 그들의 효과에도 불구하고, 그들은 여전히 고통받고 있다. 두 가지 주요 약점으로부터. 첫째, 순차적 단점 때문에 모델은 멀리 흩어져 있는 관련 정보를 통합하지 못합니다. 진실성 확인을 위한 증거들은 차치하고요 둘째로, 그들은 많은 중복을 무시한다. 쓸모없거나 심지어 해로울 수 있는 증거에 포함된 정보 로. 이러한 문제를 해결하고, 우리는 통일된 그래프 기반 sEmantic sTruxure를 제안한다. 즉, GET 프레임워크입니다. 특히, 와는 다르다. 주장과 증거를 시퀀스로 취급하는 기존 작업, 우리는 그것들을 모델링합니다. 그래프 구조화된 데이터와 사이의 장거리 의미 의존성을 포착한다. 주변 전파를 통해 관련 스니펫을 분산시킵니다. 얻은 후 문맥적 의미 정보, 우리의 모델은 정보 중복을 줄인다. 그래프 구조 학습을 수행합니다. 마지막으로, 세밀한 의미론 표현은 다운스트림 클레임-매개 상호 작용 모듈에 입력된다. 예언을 위해서요 포괄적인 실험을 통해 의 우수성이 입증되었습니다. 최첨단 기술을 극복하십시오. 

 

 

반응형