Pipeline to Detect PHI for Deidentification (Sub Entity)

Description

This pretrained pipeline is built on the top of ner_deid_subentity model.

Live Demo Open in Colab Copy S3 URI

How to use

from sparknlp.pretrained import PretrainedPipeline

pipeline = PretrainedPipeline("ner_deid_subentity_pipeline", "de", "clinical/models")

pipeline.annotate("Michael Berger wird am Morgen des 12 Dezember 2018 ins St. Elisabeth-Krankenhaus in Bad Kissingen eingeliefert. Herr Berger ist 76 Jahre alt und hat zu viel Wasser in den Beinen.")
val pipeline = new PretrainedPipeline("ner_deid_subentity_pipeline", "de", "clinical/models")


pipeline.annotate("Michael Berger wird am Morgen des 12 Dezember 2018 ins St. Elisabeth-Krankenhaus in Bad Kissingen eingeliefert. Herr Berger ist 76 Jahre alt und hat zu viel Wasser in den Beinen.")
import nlu
nlu.load("de.deid.ner_subentity.pipeline").predict("""Michael Berger wird am Morgen des 12 Dezember 2018 ins St. Elisabeth-Krankenhaus in Bad Kissingen eingeliefert. Herr Berger ist 76 Jahre alt und hat zu viel Wasser in den Beinen.""")

Results

+-------------------------+-------------------------+
|chunk                    |ner_deid_subentity_chunk |
+-------------------------+-------------------------+
|Michael Berger           |PATIENT                  |
|12 Dezember 2018         |DATE                     |
|St. Elisabeth-Krankenhaus|HOSPITAL                 |
|Bad Kissingen            |CITY                     |
|Berger                   |PATIENT                  |
|76                       |AGE                      |
+-------------------------+-------------------------+

Model Information

Model Name: ner_deid_subentity_pipeline
Type: pipeline
Compatibility: Healthcare NLP 3.4.1+
License: Licensed
Edition: Official
Language: de
Size: 1.3 GB

Included Models

  • DocumentAssembler
  • SentenceDetectorDLModel
  • TokenizerModel
  • WordEmbeddingsModel
  • MedicalNerModel
  • NerConverter