Pipeline to Extract Entities in Spanish Clinical Trial Abstracts (BertForTokenClassification)

Description

This pretrained pipeline is built on the top of bert_token_classifier_ner_clinical_trials_abstracts model.

Predicted Entities

Copy S3 URI

How to use

from sparknlp.pretrained import PretrainedPipeline

pipeline = PretrainedPipeline("bert_token_classifier_ner_clinical_trials_abstracts_pipeline", "es", "clinical/models")

text = '''Efecto de la suplementación con ácido fólico sobre los niveles de homocisteína total en pacientes en hemodiálisis. La hiperhomocisteinemia es un marcador de riesgo independiente de morbimortalidad cardiovascular. Hemos prospectivamente reducir los niveles de homocisteína total (tHcy) mediante suplemento con ácido fólico y vitamina B6 (pp), valorando su posible correlación con dosis de diálisis, función  residual y parámetros nutricionales.'''

result = pipeline.fullAnnotate(text)
import com.johnsnowlabs.nlp.pretrained.PretrainedPipeline

val pipeline = new PretrainedPipeline("bert_token_classifier_ner_clinical_trials_abstracts_pipeline", "es", "clinical/models")

val text = "Efecto de la suplementación con ácido fólico sobre los niveles de homocisteína total en pacientes en hemodiálisis. La hiperhomocisteinemia es un marcador de riesgo independiente de morbimortalidad cardiovascular. Hemos prospectivamente reducir los niveles de homocisteína total (tHcy) mediante suplemento con ácido fólico y vitamina B6 (pp), valorando su posible correlación con dosis de diálisis, función  residual y parámetros nutricionales."

val result = pipeline.fullAnnotate(text)

Results

|    | ner_chunk               |   begin |   end | ner_label   |   confidence |
|---:|:------------------------|--------:|------:|:------------|-------------:|
|  0 | suplementación          |      13 |    26 | PROC        |     0.999993 |
|  1 | ácido fólico            |      32 |    43 | CHEM        |     0.999753 |
|  2 | niveles de homocisteína |      55 |    77 | PROC        |     0.997803 |
|  3 | hemodiálisis            |     101 |   112 | PROC        |     0.999993 |
|  4 | hiperhomocisteinemia    |     118 |   137 | DISO        |     0.999995 |
|  5 | niveles de homocisteína |     248 |   270 | PROC        |     0.999988 |
|  6 | tHcy                    |     279 |   282 | PROC        |     0.999989 |
|  7 | ácido fólico            |     309 |   320 | CHEM        |     0.999987 |
|  8 | vitamina B6             |     324 |   334 | CHEM        |     0.999967 |
|  9 | pp                      |     337 |   338 | CHEM        |     0.999889 |
| 10 | diálisis                |     388 |   395 | PROC        |     0.999993 |
| 11 | función  residual       |     398 |   414 | PROC        |     0.999948 |

Model Information

Model Name: bert_token_classifier_ner_clinical_trials_abstracts_pipeline
Type: pipeline
Compatibility: Healthcare NLP 4.4.4+
License: Licensed
Edition: Official
Language: es
Size: 410.6 MB

Included Models

  • DocumentAssembler
  • SentenceDetectorDLModel
  • TokenizerModel
  • MedicalBertForTokenClassifier
  • NerConverterInternalModel