[2021-12-27] 오늘의 자연어처리
Are E2E ASR models ready for an industrial usage? The Automated Speech Recognition (ASR) community experiences a major turning point with the rise of the fully-neural (End-to-End, E2E) approaches. At the same time, the conventional hybrid model remains the standard choice for the practical usage of ASR. According to previous studies, the adoption of E2E ASR in real-world applications was hindere..
2021.12.27 -
[2021-12-24] 오늘의 자연어처리
How Should Pre-Trained Language Models Be Fine-Tuned Towards Adversarial Robustness? The fine-tuning of pre-trained language models has a great success in many NLP fields. Yet, it is strikingly vulnerable to adversarial examples, e.g., word substitution attacks using only synonyms can easily fool a BERT-based sentiment analysis model. In this paper, we demonstrate that adversarial training, the ..
2021.12.24 -
[2021-12-23] 오늘의 자연어처리
Mixed Precision DNN Qunatization for Overlapped Speech Separation and Recognition Recognition of overlapped speech has been a highly challenging task to date. State-of-the-art multi-channel speech separation system are becoming increasingly complex and expensive for practical applications. To this end, low-bit neural network quantization provides a powerful solution to dramatically reduce their ..
2021.12.23 -
자연어처리 워크샵에 페이퍼 내기
코로나 때문인건지... 알 수 없지만 내가 석사하는 동안 연구실에서 같이 논문을 쓴 게 하나도 없었다 ....... 불모지와 같은 환경에서 실적이 아예 없으니까 불안해지기 시작했고 선배가 워크샵 같은 곳은 덜 어려우니 거기에 페이퍼 내보라고 해서 준비 시작한게 올해 여름! 큰 욕심 없이 (지도교수가 논문 피드백을 거의 안 주니까..) 피드백을 받기 위해 페이퍼를 내기 시작했다. 근데 욕심이란게 그렇게 버린다고 쉽게 버려지지가 않음 ^^ 어쨌든 비대면 석사 생활을 하면서 아무것도 몰랐던 내가 페이퍼 내는 과정을 정리해본다 1. 워크샵 찾아보기 EMNLP, ACL 이런 학회 자체에 내기엔 너무 무서웠고 워크샵은 좀 덜 어려울 것 같아 워크샵을 위주로 찾았다. 구글에 그냥 EMNLP workshops, ACL..
2021.11.25 -
자연어처리와 언어학 지식
면접에서 CS가 아닌 언어학 전공자로서 무엇이 강점이냐고 물었을 때, 뭔가 답을 하긴 했지만 솔직히 나조차도 설득이 안 됐다.. 근데 이 강연을 들으니까 진짜 언어학이 중요한 것 같네!! 1. 형태소 분석기 개선 딥러닝이 해결할 수 있는 과제를 크게 3가지로 보면 1) 분류 2) 회귀 3) 생성 및 변형이다. 기존의 형태소 분석기 학습 방법은 3) 생성 및 변형 방법을 사용했다. 예를 들어, input이 '흘러'로 주어지면 그에 맞는 output으로 '흐르+어'를 생성해내는 방식이다. 그러나 이렇게 end-to-end 방식으로 학습했을 때 성능에 한계가 있었다. 이를 개선하여 형태소 분석기 구축 ..
2021.10.07 -
GPT-3 API 받았네??
굉장히 당황스럽다..! 작년 이맘때쯤 구글 닥스로 신청했던 것 같은데.. 1년 뒤에 API key를 주네ㅋㅋㅋㅋ 그래도 신기하다 베타 버전은 18달러어치까지만 무료로 이용 가능한 듯 정말 별 게 다 가능한 GPT-3... * 어린이를 위해 쉽게 요약해주기 * 일상적인 말을 프로그램 명령어처럼 바꾸기 * 상품 설명을 입력으로 주면 그에 맞는 광고 문구 쓰기..!!!! * 영화를 이모티콘으로 요약하기