nahu-klasik
nahu-klasik ialah model bahasa Arab klasik yang dibungkus untuk penggunaan Bahasa Melayu bagi tugas fill-mask dan eksplorasi kosa kata. Ia sesuai sebagai model asas untuk teks turath, kitab, atau korpus klasik lain.
Ringkasan
- Seni bina:
BertForMaskedLM - Asas model: keluarga
CAMeLBERT-CA - Domain: Arab klasik
Cara guna
from transformers import AutoTokenizer, AutoModelForMaskedLM
model_path = "koleksi-nahu/nahu-klasik"
tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModelForMaskedLM.from_pretrained(model_path)
Nota
- Model ini bukan token classifier walaupun berada dalam koleksi nahu.
- Untuk POS tagging yang terus boleh digunakan, pilih
../nahu-moden.
- Downloads last month
- 35