ABioNER: A BERT-Based Model for Arabic Biomedical Named-Entity Recognition

Nada Boudjellal; Huaping Zhang; Asif Khan; Arshad Ahmad; Rashid Naseem; Jianyun Shang; Lin Dai

首页> 外文期刊>Complexity >ABioNER: A BERT-Based Model for Arabic Biomedical Named-Entity Recognition

【24h】

ABioNER: A BERT-Based Model for Arabic Biomedical Named-Entity Recognition

机译：abioLer：一种基于BERT的阿拉伯生物医学名称实体识别模型

获取原文

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

The web is being loaded daily with a huge volume of data, mainly unstructured textual data, which increases the need for information extraction and NLP systems significantly. Named-entity recognition task is a key step towards efficiently understanding text data and saving time and effort. Being a widely used language globally, English is taking over most of the research conducted in this field, especially in the biomedical domain. Unlike other languages, Arabic suffers from lack of resources. This work presents a BERT-based model to identify biomedical named entities in the Arabic text data (specifically disease and treatment named entities) that investigates the effectiveness of pretraining a monolingual BERT model with a small-scale biomedical dataset on enhancing the model understanding of Arabic biomedical text. The model performance was compared with two state-of-the-art models (namely, AraBERT and multilingual BERT cased), and it outperformed both models with 85% F1-score.

机译：Web每天正在加载大量数据，主要是非结构化文本数据，这增加了对信息提取和NLP系统的需求显着。命名实体识别任务是有效地了解文本数据和节省时间和精力的关键步骤。在全球范围内广泛使用的语言，英语正在接管在该领域中进行的大部分研究，特别是在生物医学领域。与其他语言不同，阿拉伯语缺乏资源。这项工作提出了一种基于BERT的模型，以识别阿拉伯语文本数据（具体疾病和治疗实体）中的生物医学命名实体，该模型研究了与小型生物医学数据集预先训练单声道BERT模型的有效性，以提高阿拉伯语的模型理解生物医学文本。模型性能与两个最先进的模型进行了比较（即阿拉伯和多语言BERT外壳），并且它表现出85％F1分数的两种型号。

著录项

来源
《Complexity》 |2021年第a期|共6页
作者
Nada Boudjellal; Huaping Zhang; Asif Khan; Arshad Ahmad; Rashid Naseem; Jianyun Shang; Lin Dai;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种
中图分类大系统理论;
关键词

相似文献

外文文献
中文文献
专利

1. POSBIOTM-NER: a trainable biomedical named-entity recognition system [J] . Song Y, Kim E, Lee GG, Bioinformatics . 2005,第11期

机译：POSBIOTM-NER：可训练的生物医学命名实体识别系统
2. POSBIOTM-NER: a trainable biomedical named-entity recognition system [J] . Song Y, Kim E, Lee GG, Bioinformatics . 2005,第11期

机译：POSBIOTM-NER：可训练的生物医学命名实体识别系统
3. Features Modelling in Discrete and Continuous Hidden Markov Models for Handwritten Arabic Words Recognition [J] . Benzenache Amine, Seridi Hamid, Akdag Herman The international arab journal of information technology . 2017,第5期

机译：离散和连续隐马尔可夫模型中的特征建模用于手写阿拉伯语单词识别
4. BERT-based Multi-Task Model for Country and Province Level Modern Standard Arabic and Dialectal Arabic Identification [C] . Abdellah El Mekki, Abdelkader El Mahdaouy, Kabil Essefar, Workshop on Arabic Natural Language Processing . 2021

机译：基于BERT的国家和省级多任务模型现代标准阿拉伯语和方言阿拉伯语鉴定
5. Arabic language modeling with stem-derived morphemes for automatic speech recognition. [D] . Heintz, Ilana. 2010

机译：具有词干衍生语素的阿拉伯语言建模，可实现自动语音识别。
6. MetaMap Lite in Excel: Biomedical Named-Entity Recognition for Non-Technical Users [O] . Ravi Teja Bhupatiraju, Kin Wah Fung, Olivier Bodenreider -1

机译：Excel中的MetaMap Lite：非技术用户的生物医学命名实体识别
7. Boosting Arabic Named-Entity Recognition With Multi-Attention Layer [O] . Mohammed Nadher Abdo Ali, Guanzheng Tan, Aamir Hussain 2019

机译：将阿拉伯语命名实体识别提升，使用多关注层

ABioNER: A BERT-Based Model for Arabic Biomedical Named-Entity Recognition

摘要

著录项

相似文献

相关主题

期刊订阅