تشخیص متون توهینآمیز در موتورهای جستجو با استفاده از یادگیری ماشین - گزارش بازار ایران
طبق این گزارش که در کنفرانس تحقیق وب منتشر شده است، با توجه به گسترش محتوا در بسترهای رسانهای و ارتباطی مختلف و همچنین دسترسی کاربران به این امکانات لزوم بررسی محتوای به اشتراک گذاشته شده به ویژه در ابعاد فرهنگی و اجتماعی به منظور ارائه دادههای با کیفیت به افراد حاضر در این عرصهها همواره احساس میشود. یکی از مسائلی که در محتوای متنی به خصوص محتوای ویژه کودکان، فرهنگی، دانشگاهی و... بسیار پراهمیت است تشخیص متون توهینآمیز به کار برده شده است که در این گزارش به آن پرداخته شده است. با استفاده از یادگیری ماشین دادههای پیش پردازش شده را به مدل مورد نظر آموزش داده و انتظار میرود که خروجی مدلی باشد که با دریافت متن احتمال رکیک بودن محتوا را تشخیص دهد. در این گزارش پس از بررسی مختصر اقدامات پیشین انجام شده به ارائه راهکارهایی به منظور رفع چالشها و تشخیص توهینآمیز بودن عبارت جستجو شده خواهیم پرداخت.
مواردی که با دانلود این تحقیق بازار ایران میتوانید از آن آگاهی یابید:
- آمادهسازی دادههای متنی
- استخراج و حذف دادههای تکراری
- ساخت مجموعه داده
- نرمالسازی کلمات فارسی
- و موارد دیگر...