Description
This is a Multiclass classification model which identifies law area labels(civil_law, penal_law, public_law, social_law) in German-based Court Cases.
Predicted Entities
civil_law
, penal_law
, public_law
, social_law
How to use
document_assembler = nlp.DocumentAssembler() \
.setInputCol("text") \
.setOutputCol("document")
embeddings = nlp.BertSentenceEmbeddings.pretrained("sent_bert_multi_cased", "xx")\
.setInputCols(["document"]) \
.setOutputCol("sentence_embeddings")
docClassifier = legal.ClassifierDLModel.pretrained("legclf_law_area_prediction_german", "de", "legal/models")\
.setInputCols(["sentence_embeddings"])\
.setOutputCol("category")
nlpPipeline = nlp.Pipeline(stages=[
document_assembler,
embeddings,
docClassifier
])
df = spark.createDataFrame([["Demnach erkennt das Bundesgericht: 1. Auf die Beschwerde wird nicht eingetreten. 2. Das Gesuch um unentgeltliche Rechtspflege und Verbeiständung wird abgewiesen. 3. Es werden keine Kosten erhoben. 4. Dieses Urteil wird den Parteien und dem Kantonsgericht des Kantons Schwyz, 1. Rekurskammer, schriftlich mitgeteilt. Lausanne, 21. Oktober 2008 Im Namen der II. zivilrechtlichen Abteilung des Schweizerischen Bundesgerichts Der Präsident: Der Gerichtsschreiber: Raselli von Roten"]]).toDF("text")
model = nlpPipeline.fit(df)
result = model.transform(df)
result.select("text", "category.result").show(truncate=100)
Results
+----------------------------------------------------------------------------------------------------+-----------+
| text| result|
+----------------------------------------------------------------------------------------------------+-----------+
|Demnach erkennt das Bundesgericht: 1. Auf die Beschwerde wird nicht eingetreten. 2. Das Gesuch um...|[civil_law]|
+----------------------------------------------------------------------------------------------------+-----------+
Model Information
Model Name: | legclf_law_area_prediction_german |
Compatibility: | Legal NLP 1.0.0+ |
License: | Licensed |
Edition: | Official |
Input Labels: | [sentence_embeddings] |
Output Labels: | [class] |
Language: | de |
Size: | 22.4 MB |
References
Train dataset available here
Benchmarking
label precision recall f1-score support
civil_law 0.94 0.94 0.94 1058
penal_law 0.99 0.93 0.96 929
public_law 0.92 0.96 0.94 965
social_law 0.99 0.99 0.99 1003
accuracy - - 0.96 3955
macro-avg 0.96 0.96 0.96 3955
weighted-avg 0.96 0.96 0.96 3955