Pipeline to Detect PHI for Deidentification (Generic)

Description

This pretrained pipeline is built on the top of ner_deid_generic model.

Live Demo Open in Colab Copy S3 URI

How to use

from sparknlp.pretrained import PretrainedPipeline

pipeline = PretrainedPipeline("ner_deid_generic_pipeline", "de", "clinical/models")


pipeline.annotate("Michael Berger wird am Morgen des 12 Dezember 2018 ins St. Elisabeth-Krankenhaus in Bad Kissingen eingeliefert. Herr Berger ist 76 Jahre alt und hat zu viel Wasser in den Beinen.")
val pipeline = new PretrainedPipeline("ner_deid_generic_pipeline", "de", "clinical/models")


pipeline.annotate("Michael Berger wird am Morgen des 12 Dezember 2018 ins St. Elisabeth-Krankenhaus in Bad Kissingen eingeliefert. Herr Berger ist 76 Jahre alt und hat zu viel Wasser in den Beinen.")
import nlu
nlu.load("de.med_ner.deid_generic.pipeline").predict("""Michael Berger wird am Morgen des 12 Dezember 2018 ins St. Elisabeth-Krankenhaus in Bad Kissingen eingeliefert. Herr Berger ist 76 Jahre alt und hat zu viel Wasser in den Beinen.""")

Results

+-----------------------------------------+---------+
|chunk                                    |ner_label|
+-----------------------------------------+---------+
|Michael Berger                           |NAME     |
|12 Dezember 2018                         |DATE     |
|St. Elisabeth-Krankenhausin Bad Kissingen|LOCATION |
|Berger                                   |NAME     |
|76                                       |AGE      |
+-----------------------------------------+---------+

Model Information

Model Name: ner_deid_generic_pipeline
Type: pipeline
Compatibility: Healthcare NLP 3.4.1+
License: Licensed
Edition: Official
Language: de
Size: 1.3 GB

Included Models

  • DocumentAssembler
  • SentenceDetectorDLModel
  • TokenizerModel
  • WordEmbeddingsModel
  • MedicalNerModel
  • NerConverter