اولین پیش‌نشست همایش ملی هوش مصنوعی و علوم اسلامی 29 فروردین 1398، در سالن اجتماعات مرکز تحقیقات کامپیوتری علوم اسلامی برگزار می‌شود.

اولین پیش‌نشست همایش ملی هوش مصنوعی و علوم اسلامی با سخنرانی آیت الله شهریاری، رئیس مرکز تحقیقات کامیوتری علوم اسلامی (نور)، برگزار می‌شود.

گفتنی است، اولین همایش ملی هوش مصنوعی و علوم اسلامی، با همکاری مرکز تحقیقات کامپوتری علوم اسلامی، مرکز مدیریت حوزه‌های علمیه، دانشگاه  علم و صنعت ایران و موسسه اشراق و عرفان در تاریخ 16 بهمن 1398 در مدرسه معصومیه قم، برگزار خواهد شد.

لازم به ذکر است، اولین پیش‌نشست این همایش، 29 فروردین 1398، ساعت 11 الی 13 در سالن اجتماعات مرکز تحقیقات کامپیوتری علوم اسلامی برگزار می‌شود.

شرکت گروه پردازش هوشمند نور در ششمین همایش ملی مدیران فناوری اطلاعات(ایرانداک) و نمایشگاه تخصصی ItManC2018

گروه پردازش داده هوشمند نور به‌منظور ارائه دستاوردهای خود با برپایی غرفه مرکز تحقیقات کامپیوتری علوم اسلامی نور در نمایشگاه تخصصی ItManC2018 شرکت نمود.

ارائه دستاوردهای چون آیه یاب، حدیث یاب، تبدیل تصویر به متن، جستجوی تصویری پایگاه نورمگز، سرویس تشخیص موجودیت‌های عربی و فارسی، سرویس پیشنهاددهنده هوشمند، خلاصه‌ساز، اعراب گذار، تحلیل صرفی کلمات، تحلیل نحوی آیات قرآن کریم، ریشه یاب، دسته بندی متون مدل سازی مفهومی، ابر کلیدواژه و سایر دستاوردهای بخش پردازش هوشمند مورد استقبال علاقه‌مندان قرار گرفت.

ششمین همايش ملی مديران فناوري اطلاعات و نمایشگاه تخصصی ItManC2018  در سال 1397 به پشتوانه تجربه چند دهه فعالیت پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک) با رویکرد میان‌رشته‌ای و با شعار «کسب‌وکار داده محور در خدمت جامعه» به‌منظور آشنایی و تبادل دیدگاه‌ها، دستاوردها و تجربه‌های فرهنگی، مدیریتی و فناورانه حاصل از به‌کارگیری فناوری اطلاعات در تاریخ چهارم دی‌ماه 97 در مرکز همایش‌های بین‌المللی صداوسیما برگزار شد.

 

 

 

ارجاع هوشمند پاورقی‌ها در پایگاه نورلایب

با توجه به اینکه ارجاعات در یک کتاب به منابع دیگر معمولاً در پاورقی‌ها صورت می‌گیرد و مراجعه به آن‌ها توسط پژوهشگر علاوه بر زمانبر بودن، رویه مطالعه و پژوهش را نیز مختل می‌کند و از طرف دیگر امکان ارجاع‌دهی دستی با توجه به حجم بالای منابع وجود ندارد. مرکز تحقیقات کامپیوتری علوم اسلامی پروژه لینک‌دهی پاورقی کتاب‌ها در پایگاه کتابخانه تخصصی نور (نورلایب) را به صورت هوشمند انجام داده است.

 

گفتنی است، با توجه به تنوع ارجاعات، نام کتاب، نویسنده و همچنین تنوع در چاپ کتاب‌ها، الگوریتم بدست آوردن این لینک‌ها به صورت ماشینی نیازمند سیستم پیچیده‌ای برای تحلیل پاورقی‌ها بود که این مهم با تلاش مهندسان بخش پردازش هوشمند با موفقیت انجام شد و با دقت قابل قبولی بیش از 4 میلیون ارجاع را در پایگاه کتابخانه تخصصی نور (نورلایب) به صورت خودکار و هوشمند استخراج و در اختیار کاربران قرار داد.

 

لازم به ذکر است، پاورقی‌های هوشمند نورلایب علاوه بر اعتبارسنجی، به منبع اصلی نیز متصل شده‌‌اند و با مراجعه کاربر به منبع، متن مورد نظر در کتاب اصلی به صورت متمایز نمایش داده می‌شود تا پژوهشگر بتواند قبل و بعد متن مورد پژوهش خود را نیز بررسی نماید.

ارائه لیست كلمات “قرآن کریم” به همراه پیراسته و ریشه صرفی

دسترسی به هسته اصلی(پیراسته) و ریشه صرفی کلمات از جمله ملاک‌های ارزشمندی هستند که دقت تحلیل متون عربی را به نحو بسزایی بهبود می‌بخشند. به همین منظور دیتای صرفی مربوط به کلمات قرآن که شامل این چند ویژگی جدید هستند با کمک تحلیل‌گر صرفی نور و در نهایت بررسی و تکمیل آن توسط زبان‌شناسان زبان عربی در قالب XML به منظور پردازش‌های روان‌تر و راحت‌تر ارائه گردید.

از ویژگی های اصلی این دیتا پیراسته سازی کلمات است بدین معنا که پیشوندها و پسوندها از هسته اصلی کلمه تفکیک شده است. ریشه صرفی نیز برای کلماتی که در زبان عربی ریشه ای برای آن‌ها وجود دارد، آورده شده است.

علاوه بر این در این دیتا کل کلمات قرآن کریم از طریق شماره سوره، شماره آیه و شماره کلمه قابل دستیابی می‌باشند.

به عنوان مثال کلمه “لِنُورِهِ” به صورت زیر آمده است:

<Word entry=”لِنُورِهِ” root=”نور” sureh=”24″ aye=”36″ id=”51941″>
<Subword subEntry=”لِ” IsBase=”0″ />
<Subword subEntry=”نُورِ” IsBase=”1″ />
<Subword subEntry=”هُ” IsBase=”0″ />
</Word>

“گروه متن‌كاوی نور” امیدوار است كه استفاده از این دستاورد برای پژوهشگران و تحلیل‌گران محترم مفید و مؤثر واقع گردد.

لازم به ذکر است حق مالکیت معنوی این دیتا متعلق به مرکز تحقیقات کامپیوتری علوم اسلامی- نور  می باشد و استفاده غیر تجاری از آن با ذکر نام مرکز بلامانع می باشد.

دیتای مذكور از لینك زیر قابل دسترسی می باشد.

 

قابلیت جستجو در صوت برای محصولات نور فراهم شد

به همت مهندسین فنی مرکزنور قابلیت جستجو و یافتن کلمه یا عبارت در فایل های صوتی برای اولین بار در محصولات نور با بهره گیری از قابلیت Speech to Text فراهم شد.

به گزارش نورسافت، مسئول اداره پردازش هوشمند معاونت فنی مرکز نور در این باره گفت: این قابلیت برای نخستین بار در نرم افزار مقتل الحسین(ع) به اجرا در آمده است ، کاربران می توانند با جستجوی کلمه یا عبارت  مورد نظرشان آن  را در انبوه فایل های صوتی سخنرانی  بیابند

وی ادامه داد: با توجه به برنامه ریزی های انجام شده قرار است برای تولیدات جدید مرکز نور که دارای بخش چند رسانه و فایل صوتی هستند این قابلیت ارائه شود.

پیشنهاد کاربران؛ کشف هوشمند مقالات مرتبط بر اساس بازدید کاربران

از آغاز تولد نورمگز، کاربران فراوانی مقالاتش را دیده و بارگیری کرده‌اند. کسانی که موضوعی خاص را در این پایگاه دنبال می‌کنند، به شیوه‌های گوناگونی به جست‌وجوی آن می‌پردازند. آمار ثبت هم‌افزایی کاربران فراوان نورمگز، به خودشان عرضه شده؛ یعنی با توجه به پیشینه بینندگان یک مقاله، این نتیجه حاصل آمده است که دیگر مقالات دیده شده همراه با آن مقاله، چه عنوان‌هایی داشته‌اند. چنانچه سطح آماری همه مشاهده‌های دو مقاله دیده شدة هم‌زمان بالا باشد، بسیار محتمَل است که آن دو مقاله با یک‌دیگر مرتبط باشند.

با توجه به «لاگ‌»های بیشتر کاربران، نتایج بهتری فراهم خواهد آمد. البته این سامانه با استفاده از لاگ مشاهده کاربران پدید آمده است و خطاپذیری‌اش بسیار امکان‌پذیر خواهد بود. این شیوه غنی‌سازی مقالات؛ یعنی ارائه مقاله‌های مرتبط با یک مقاله خاص، به صورت دستی ناممکن می‌نماید. بنابراین، پیش‌نهاد می‌شود اگر پاسخ‌های بیشتر و بهتری را درباره پژوهش خود دنبال می‌کنید، از نتایج تحقیق دیگر کاربران پایگاه در این «ماژول» بهره ببرید. مقالاتی که کاربران بیشتری آنها را دیده‌اند، پاسخ‌های بهتری به دنبال خواهند آورد. با توجه به اینکه این مقالات مرتبط از طریق لاگ کاربران فراهم شده‌اند، هر از گاهی روزآمد خواهند شد. پس مقالات مرتبط با یک مقاله در این سامانه همواره ثابت نیستند، بلکه همواره دگرگون می‌شوند.

عنوان‌های هم‌سان؛ کشف هوشمند عنوان‌های هم‌سانِ مقاله‌ای از انبوه مقالات

روزانه مقالات و اخبار و اسناد متنی فراوانی در محیط رقومی (دیجیتال) تولید و منتشر می‌شود که بررسی درون‌مایه این حجم گسترده اطلاعات، به آسانی امکان‌پذیر نخواهد بود، بلکه مشکلاتی پدید خواهد آورد. شمار فراوان متن‌ها، گوناگونی زبانی آنها، طول‌های مختلف و رمزینه‌های متفاوتشان، از دشواری‌های کار با اسناد متنی به شمار می‌روند.

کارشناسان شاخه‌های علمی مختلف، برای حل این مشکل دست گشاده‌اند. برای نمونه متخصصان هوش مصنوعی، بازیابی اطلاعات، داده‌کاوی و متن‌کاوی و مشابه‌‌یابی متون، کارهای صورت داده و به کمک دانش‌های بازیابی اطلاعات برای حل این مشکلات پیش‌نهادهایی عرضه کرده‌اند. این مقاله، با نام «عنوان‌های هم‌سان»، از این مشابه‌یاب‌هاست که با توجه به داده‌های فراوان پایگاه مجلات «noormags» تولید و عرضه شده است.

عنوان‌های هم‌سان، خصلتی برای کشف هوش‌مند عنوان‌های مشابه مقاله‌هاست که به کمک ترفندهای (Technics) متن‌کاوی و هوش مصنوعی، در بازدید هر مقاله، مشابه‌ترین مقالات را از دید عنوان به کاربر پیشنهاد می‌کند. یافتن مقالات مرتبط با هر مقاله، دغدغه‌ای پژوهشی است که برای سامان‌دهی پژوهش‌های فراگیر و نامکرّر در کم‌ترین زمان، باید بدان پاسخ گفت. هم‌چنین اصلی‌ترین شیوه برای شناخت ارتباط مقالات با یک‌دیگر، بررسی الفاظ مشترک میان عنوان‌های آنهاست. این ابزار از عنوان مقالات برای شناسایی ارتباط آنها با یک‌دیگر بهره می‌گیرد.

بهره‌گیری از مشابه‌یاب‌ها برای کشف روابط پنهان داده‌های متنی با یک‌دیگر، کاربردهای گوناگونی دارد. برخی از این کاربردها در پایگاه‌های خبری و برای شناسایی ارتباط خبرهای مختلف با یک‌دیگر رواج دارد. نمونه چنین کاربردی را در بخش اخبار پایگاه گوگل[1] یا بخش «در همین زمینه» پایگاه خبری هم‌شهری[2] می‌توان دید. این ویژگی هم‌چنین در پایگاه‌های علمی گنجانده شده است که بخش «See also» دانش‌نامه [3]«Wikipedia»، از آن بهره می‌گیرد.

تنها ویژگی کاربردی در فرآیند مشابه‌یابی، عنوان مقاله‌هاست، اما طراحان نورمگز کوشیده‌اند که مشابه‌یابی‌ها از سطح لفظ عنوان مقالات بگذرند و به معنا و موضوع آنها نزدیک‌تر شود. از این‌رو، آزمون‌های گوناگونی در بخش متن‌کاوی مرکز تحقیقات کامپیوتری علوم اسلامی صورت گرفت تا این گذر به شیوه بهتری صورت پذیرد. سامان‌دهی «لایه‌ای از خوشه‌بندی معنایی کلمات»، نمونه‌ای از ترفند‌ها در این آزمون‌هاست. این ترفند به کشف بسیاری از روابط «باهم‌آیی کلمات» خواهد انجامید. باهم‌آیی دو کلمه با یک‌دیگر بدین معناست که حضور یکی از آن کلمات، حضور دیگری را در پی خواهد داشت. برای نمونه، با رخداد کلمه‌ای مانند «نفت« بسیار محتمَل است که واژه «گاز» نیز به کار رود. از سوی دیگر، باهم‌آیی دو کلمه، نشان‌دهنده مشترکاتی میان آنهاست. این مشترکات در بسیاری از کلمات، خصال معنایی آنهایند. از این‌رو، فرآیند خوشه‌بندی معنایی به کمک رابطه‌ باهم‌آیی آنها امکان‌پذیر خواهد بود.

گفتنی است ترفندهای معمول در این ویژگی، با دیگر موتور جست‌جو متفاوتند و کارکردهایی دارند که خود حاصل پژوهش‌های محققان بومی است. خوشه‌بندی کلمات و جداسازی واژگان کلیدی از دیگر واژگان و مؤثرتر کردن آنها برای محاسبات مشابه‌یابی، از ویژگی‌های این ابزار به شمار می‌روند. البته این ویژگی‌ها در دست گسترشند؛ چنان‌که به خواست خدا ویژگی عنوان‌های هم‌سان در نسخه‌های آینده، از دقت و کیفیت بیش‌تری برخوردار خواهند بود.

بخش متن‌کاوی مرکز تحقیقات کامپیوتری علوم اسلامی امیدوار است که با عرضه این ویژگی، راه پژوهش برای محققان حوزه و دانشگاه هموارتر شود.

دسترسی به فنّاوری تبدیل تصویر به متن (OCR)

به همت مرکز نور دسترسی به فنّاوری تبدیل تصویر به متن (OCR) باهدف گسترش ارائه خدمات پژوهشی و تحقیقاتی فراهم شد.

مدیر اداره پردازش هوشمند مرکز نور در گفت‌وگو با نورسافت با اعلام این خبر افزود: این قابلیت پردازشی هوشمند با هدف گسترش در ارائه خدمات پژوهشی و تحقیقاتی به طلاب و دانشجویان در مرکز نور شکل‌گرفته است و چند میلیون صفحه OCR  شده، قابلیت جستجو را پیداکرده‌اند.

مهندس حسین جوزی افزود: تبدیل تصویر به متن یکی از شیوه‌های اساسی در جستجو پذیر کردن منابع تصویری است به‌نحوی‌که استفاده از متن OCR شده در موتور جستجو و رنگی کردن جستجو در تصویر را برای کاربر فراهم می‌آورد.

پیش‌ازاین جستجو فقط در منابع تایپ‌شده فراهم بود، که سالانه هزینه و زمان زیادی در حوزه رقومی سازی نسخ چاپی مختلف (کتب، مجلات، پایان‌نامه‌ها و …) تخصیص داده می‌شود، ولی اکنون جستجو در متن کامل مجلاتی که در نور اسکن شده و با نویسه‌خوان نوری تبدیل به متن شده است برای محققین فراهم گردیده است.
search.png

وی ادامه داد: فنّاوری تبدیل تصویر به متن در حال حاضر با اولویت مقالات مجلات پایگاه نورمگز با حجمی بالغ‌ بر نه میلیون صفحه و در ادامه در منابع پایگاه نورلایب دنبال خواهد شد.

بهره‌برداری از خلاصه ساز متون نور در نورمگز

با گسترش روزافزون حجم اطلاعات موجود در وب و افزايش چشم‌گير مقالات منتشر شده در زمينه‌هاي مختلف علمي، دسترسي سریع و مطالعه اطلاعات مورد نياز، همواره يکي از مشکلات محققان و پژوهشگران بوده است. از این رو مرکز تحقیقات کامپیوتری علوم اسلامی (نور)، که همواره با تولیدات خود در جهت تسهیل امر پژوهش گام بر می‌دارد؛ با به کارگیری نیروی متخصص و استفاده از جدیدترین امکانات نرم‌افزاری، اقدام به راه اندازی سیستم خلاصه ساز متون نور نموده است.

گفتنی است؛ با استفاده از این این سامانه می‌توان از هر متن، بخش‌های مهم آن را پیدا و دسته بندی نمود و یا مقاله یا تحقیقی را خلاصه نمود و به راحتی به مطالعه آن‌ها پرداخت.

بر اساس این گزارش؛ در تولید سامانه خلاصه ساز متون نور، متخصصان مرکز تحقیقات کامپیوتری علوم اسلامی، تمرکز خود را بر استفاده از روش‌هایی قرار دادند که بتواند در کوتاه‌ترین زمان، خلاصه هایی پر محتوا، سلیس و روان را به نمایش بگذارد؛ از این رو در پیاده سازی این سامانه از الگوریتم تشخیص و تعیین مهمترین جملات متن “Text Rank” استفاده شده است که با سرعت بسیار بالایی در کمترین زمان ممکن قادر است متون طولانی را با دقت و کیفیت بسیار بالا خلاصه سازی نموده و در معرض نمایش قرار دهد.

لازم به ذکر است؛ روش‌ بکار رفته در خلاصه‌سازی این سامانه، علاوه بر ارزیابی‌های اولیه، توسط روش ارزیابی”Rouge” که به مقایسه خلاصه ماشینی با خلاصه تولید شده توسط انسان می‌پردازد نیز مورد بررسی قرار گرفته است.

هم چنین جهت اطمینان حداکثری از کیفیت خروجی، مهندسان مرکز تحقیقات کامپیوتری علوم اسلامی (نور)، به مقایسه خلاصه‌های تولید شده توسط این سامانه و چکیده نوشته شده توسط نویسنده مقالات نیز پرداختند که در پایان، خروجی این سامانه با ضریب اطمینان بیشتری همراه بود.

گفتنی است؛ هم اکنون این سامانه در پایگاه مجلات تخصصی نور( نورمگز)، به منظور تهیه خلاصه برای مقالات این پایگاه مورد بهره‌برداری قرار گرفته و نتایج آن تحت عنوان خلاصه ماشینی قابل مشاهده می باشد.

راه‌اندازی سرویس پیشنهاد جستجوی کلمات نورلایب

به گزارش نورسافت؛ در راستای بهبود و تسهیل دسترسی سریع کاربران به منابع موجود در وب‌سایت کتابخانه دیجیتال نور، سرویس پیشنهاد جستجوی کلمات و ترکیبات مرتبط بر روی موتور جستجوی این پایگاه اینترنتی راه اندازی شد.

بر اساس این گزارش؛ سرویس فوق با استفاده از سوابق جستجوی کاربران در پایگاه‌های اینترنتی نورلایب (کتابخانه دیجیتال نور) و نورمگز (مجلات تخصصی نور)، کلمات و ترکیبات مرتبط با جستجوی فعلی را همزمان با اعلام نتیجه، به عنوان پیشنهاد برای جستجو نمایش می‌دهد.به عنوان مثال چنانچه کاربر کلمات “سبک زندگی” را در متن کتب جستجو کند، بعد از نمایش لیست نتایج جستجو، فهرستی از عبارات پیشنهادی همچون سبک زندگی اسلامی، مفهوم سبک زندگی، سبک زندگی غربی، سبک زندگی ایرانی اسلامی و … برای جستجوی دقیق‌تر، به صورت جداگانه نمایش داده می‌شود.

گفتنی است؛ سرویس پیشنهاد جستجوی کلمات و ترکیبات مرتبط، سال گذشته بر روی وب‌سایت مجلات تخصصی نور(www.noormags.ir) راه‌اندازی شده بود و اکنون این سرویس در پایگاه کتابخانه دیجیتال نور (www.noorlib.ir) نیز در دسترس است.