Pipeline to Extract Negation and Uncertainty Entities from Spanish Medical Texts (BertForTokenClassification)

Description

This pretrained pipeline is built on the top of bert_token_classifier_negation_uncertainty model.

Predicted Entities

Copy S3 URI

How to use

from sparknlp.pretrained import PretrainedPipeline

pipeline = PretrainedPipeline("bert_token_classifier_negation_uncertainty_pipeline", "es", "clinical/models")

text = '''Con diagnóstico probable de cirrosis hepática (no conocida previamente) y peritonitis espontanea primaria con tratamiento durante 8 dias con ceftriaxona en el primer ingreso (no se realizó paracentesis control por escasez de liquido). Lesión tumoral en hélix izquierdo de 0,5 cms. de diámetro susceptible de ca basocelular perlado.'''

result = pipeline.fullAnnotate(text)
import com.johnsnowlabs.nlp.pretrained.PretrainedPipeline

val pipeline = new PretrainedPipeline("bert_token_classifier_negation_uncertainty_pipeline", "es", "clinical/models")

val text = "Con diagnóstico probable de cirrosis hepática (no conocida previamente) y peritonitis espontanea primaria con tratamiento durante 8 dias con ceftriaxona en el primer ingreso (no se realizó paracentesis control por escasez de liquido). Lesión tumoral en hélix izquierdo de 0,5 cms. de diámetro susceptible de ca basocelular perlado."

val result = pipeline.fullAnnotate(text)

Results

|    | ner_chunk                                              |   begin |   end | ner_label   |   confidence |
|---:|:-------------------------------------------------------|--------:|------:|:------------|-------------:|
|  0 | probable                                               |      16 |    23 | UNC         |     0.999994 |
|  1 | de cirrosis hepática                                   |      25 |    44 | USCO        |     0.999988 |
|  2 | no                                                     |      47 |    48 | NEG         |     0.999995 |
|  3 | conocida previamente                                   |      50 |    69 | NSCO        |     0.999992 |
|  4 | no                                                     |     175 |   176 | NEG         |     0.999995 |
|  5 | se realizó paracentesis control por escasez de liquido |     178 |   231 | NSCO        |     0.999995 |
|  6 | susceptible de                                         |     293 |   306 | UNC         |     0.999986 |
|  7 | ca basocelular perlado                                 |     308 |   329 | USCO        |     0.99999  |

Model Information

Model Name: bert_token_classifier_negation_uncertainty_pipeline
Type: pipeline
Compatibility: Healthcare NLP 4.4.4+
License: Licensed
Edition: Official
Language: es
Size: 410.6 MB

Included Models

  • DocumentAssembler
  • SentenceDetectorDLModel
  • TokenizerModel
  • MedicalBertForTokenClassifier
  • NerConverterInternalModel