ارائه لیست كلمات “قرآن کریم” به همراه پیراسته و ریشه صرفی

دسترسی به هسته اصلی(پیراسته) و ریشه صرفی کلمات از جمله ملاک‌های ارزشمندی هستند که دقت تحلیل متون عربی را به نحو بسزایی بهبود می‌بخشند. به همین منظور دیتای صرفی مربوط به کلمات قرآن که شامل این چند ویژگی جدید هستند با کمک تحلیل‌گر صرفی نور و در نهایت بررسی و تکمیل آن توسط زبان‌شناسان زبان عربی در قالب XML به منظور پردازش‌های روان‌تر و راحت‌تر ارائه گردید.

از ویژگی های اصلی این دیتا پیراسته سازی کلمات است بدین معنا که پیشوندها و پسوندها از هسته اصلی کلمه تفکیک شده است. ریشه صرفی نیز برای کلماتی که در زبان عربی ریشه ای برای آن‌ها وجود دارد، آورده شده است.

علاوه بر این در این دیتا کل کلمات قرآن کریم از طریق شماره سوره، شماره آیه و شماره کلمه قابل دستیابی می‌باشند.

به عنوان مثال کلمه “لِنُورِهِ” به صورت زیر آمده است:

<Word entry=”لِنُورِهِ” root=”نور” sureh=”24″ aye=”36″ id=”51941″>
<Subword subEntry=”لِ” IsBase=”0″ />
<Subword subEntry=”نُورِ” IsBase=”1″ />
<Subword subEntry=”هُ” IsBase=”0″ />
</Word>

“گروه متن‌كاوی نور” امیدوار است كه استفاده از این دستاورد برای پژوهشگران و تحلیل‌گران محترم مفید و مؤثر واقع گردد.

لازم به ذکر است حق مالکیت معنوی این دیتا متعلق به مرکز تحقیقات کامپیوتری علوم اسلامی- نور  می باشد و استفاده غیر تجاری از آن با ذکر نام مرکز بلامانع می باشد.

دیتای مذكور از لینك زیر قابل دسترسی می باشد.

 

0 پاسخ

دیدگاه خود را ثبت کنید

Want to join the discussion?
Feel free to contribute!

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *