پیکره بی‌جن‌خان

پیکره بی‌جن‌خان یک پیکرهٔ برچسب‌گذاری‌شده است که برای تحقیق پردازش زبان طبیعی در زبان فارسی مناسب است. این مجموعه از اخبار و متون عمومی گردآوری شده‌است. در این مجموعه، تمام مستندات بر حسب موضوعات و بر اساس حدود ۴۳۰۰ موضوع مانند سیاسی، فرهنگی و غیره طبقه‌بندی شده‌اند. این پیکره دربرگیرندهٔ نزدیک به ۲٫۶ میلیون کلمه است که به صورت دستی برچسب‌گذاری شده‌اند.[1]

پیکرهٔ بی‌جن‌خان توسط گروه تحقیقات پایگاه داده در دانشگاه تهران ایجاد شده‌است. این پیکره برای مصارف تجاری رایگان نیست؛ با این حال، این محدودیت‌ها برای همهٔ کشورها یکسان نیست. این پیکره، به افتخار محمود بی‌جن‌خان، استاد زبان‌شناسی دانشگاه تهران و خدمات او در این زمینه، چنین نام‌گذاری شده‌است.

جستارهای وابسته

منابع

وبگاهِ دادگان

مشارکت‌کنندگان ویکی‌پدیا. «Bijankhan Corpus». در دانشنامهٔ ویکی‌پدیای انگلیسی، بازبینی‌شده در ۱۴ مارس ۲۰۱۹.

پیوند به بیرون

پیکرهٔ بی‌جن‌خان

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.

[1] وبگاهِ دادگان

زبان‌شناسی پیکره‌ای
پیکره‌های متنی، انگلیسی	پیکرهٔ ملی آمریکا ‏(en)‏ بانک زبان انگلیسی ‏(en)‏ پیکرهٔ برگن ویژهٔ زبان نوجوانان لندن ‏(en)‏ پیکرهٔ ملی بریتانیا ‏(en)‏ پیکرهٔ براون ‏(en)‏ پیکرهٔ باکای ‏(en)‏ پیکرهٔ انگلیسی کمبریج ‏(en)‏ پیکره انگلیسی آمریکایی معاصر پیکرهٔ اِنرون ‏(en)‏ مجموعه‌پیکره‌های ده‌ده ‏(en)‏ پیکرهٔ بین‌المللی انگلیسی ‏(en)‏ پیکرهٔ لنکستر–اسلو–برگن ‏(en)‏ پیکرهٔ انگلیسی آکسفورد ‏(en)‏ پراپ‌بَنک ‏(en)‏ پیکرهٔ گفتاریِ انگلیسی ‏(en)‏ تی‌آی‌ام‌آی‌تی ‏(en)‏ وِرب‌نِت ‏(en)‏ پیکرهٔ ولینگتون انگلیسی گفتاری نیوزیلند، ولینگتون ‏(en)‏
پیکره‌های متنی، غیرانگلیسی	پیکره بی‌جن‌خان پیکرهٔ چایلدز ‏(en)‏ پیکرهٔ زبان کرواتی ‏(en)‏ پیکرهٔ ملی زبان کرواتی ‏(en)‏ پیکرهٔ ملی چکی ‏(en)‏ پیکرهٔ یوروپارل ‏(en)‏ پیکرهٔ مرجع آلمانی ‏(en)‏ پیکرهٔ همشهری پیکرهٔ ملی لهستانی ‏(en)‏ طرح پیکرهٔ متنی آشوری نو ‏(en)‏ پیکرهٔ عربی قرآنی ‏(en)‏ پیکرهٔ ملی روسی ‏(en)‏ پیکرهٔ متن‌ها و گفتارهای اسکاتلندی ‏(en)‏ پیکرهٔ ملی اسلوونیایی ‏(en)‏ تاک‌بَنک ‏(en)‏ تاتوئیبا ‏(en)‏ پیکرهٔ تک‌زبانهٔ تهران تاکستارو د اسپرانتو ‏(en)‏ مجموعه‌پیکره‌های ده‌ده ‏(en)‏ گنج‌واژهٔ زبان یونانی ‏(en)‏
نهادها و سازمان‌ها	کنسرسیوم پیکرهٔ ملی بریتانیا ‏(en)‏ پیکرهٔ کوبیلد ‏(en)‏ اِسکِچ اِنجین ‏(en)‏