Your browser doesn't support javascript.
loading
GNI Corpus Version 1.0: Annotated Full-Text Corpus of Genomics & Informatics to Support Biomedical Information Extraction
Genomics & Informatics ; : 75-77, 2018.
Artículo en Inglés | WPRIM | ID: wpr-716819
ABSTRACT
Genomics & Informatics (NLM title abbreviation Genomics Inform) is the official journal of the Korea Genome Organization. Text corpus for this journal annotated with various levels of linguistic information would be a valuable resource as the process of information extraction requires syntactic, semantic, and higher levels of natural language processing. In this study, we publish our new corpus called GNI Corpus version 1.0, extracted and annotated from full texts of Genomics & Informatics, with NLTK (Natural Language ToolKit)-based text mining script. The preliminary version of the corpus could be used as a training and testing set of a system that serves a variety of functions for future biomedical text mining.
Asunto(s)

Texto completo: Disponible Índice: WPRIM (Pacífico Occidental) Asunto principal: Semántica / Procesamiento de Lenguaje Natural / Almacenamiento y Recuperación de la Información / Genoma / Genómica / Informática / Minería de Datos / Corea (Geográfico) / Lingüística País/Región como asunto: Asia Idioma: Inglés Revista: Genomics & Informatics Año: 2018 Tipo del documento: Artículo

Similares

MEDLINE

...
LILACS

LIS

Texto completo: Disponible Índice: WPRIM (Pacífico Occidental) Asunto principal: Semántica / Procesamiento de Lenguaje Natural / Almacenamiento y Recuperación de la Información / Genoma / Genómica / Informática / Minería de Datos / Corea (Geográfico) / Lingüística País/Región como asunto: Asia Idioma: Inglés Revista: Genomics & Informatics Año: 2018 Tipo del documento: Artículo