كشف سرقت ادبی – تشخیص پلاگاریسم (Plagiarism)

1. كشف سرقت ادبی در متون فارسی با كمك الگوریتم SimHash

خلاصه مقاله:

دسترسی آسان به وب، پایگاه داده های بزرگ و به طور كلی ارتباطات از راه دور باعث شده كه سرقت ادبی به یك مشكل بزرگ برای ناشران، محققان و موسسات آموزشی تبدیل شود. در زبان انگلیسی این مسئله به طور جدی مورد اهمیت بوده و ابزارهای قدرتمندی برای جلوگیری از این مسئله تهیه شده است، اما متاسفانهتاكنون در این باره به صورت جدی در زبان فارسی به آن پرداخته نشده است. این مقاله به بررسی سرقت ادبی در متون فارسی بر اساس الگوریتم simhash می پردازد. الگوریتم simhash از دسته الگوریتم های اثر انگشت است. ویژگی اصلی الگوریتم های اثر انگشت، سرعت بالای آنها در كشف سرقت ادبی است. قبل از بكارگیری الگوریتم، می بایست عملیات پیش پردازش شامل: حذف تگ های نسخه اینترنتی مقاله، جداسازی كلمات، یكسان سازی، جایگزینی اعداد, حذف واژه های عمومیو ریشه یابی روی متون صورت گیرد. در این مقاله simhash و shingling بررسی و با یكدیگر مقایسه می شوند. پیاده سازی این دو الگوریتم روی یك مجموعه بزرگی از مقالات ثبت شده در پایگاه داده نور، نتایج قابل قبولی را نشان می دهد

كلمات كلیدی:

سرقت ادبی، اثر انگشت، فاصله همینگ، shingling، simHash

بررسی روشهای تشخیص سرقت علمی – ادبی بیرونی درمحیط تك زبانه

خلاصه مقاله:

تشخیص سرقت علمی ادبی میتواند نقش مهمی رادرتشخیص سرقت ایده ها درمقالات مجلات و وب سایت های اینترنتی داشته باشد چك كردن دستی آن درحال حاضرباتوجه به وجود حجم بالای منابع دیجیتال بسیاردشواروغیرممكن است تكنیكهای مختلفی برای تشخیص آن بصورت نرم افزاری وجود دارد كه دراین مقاله روشهای تشخیص سرقت علمی ادبی بیرونی به همراه نقاط ضعف وقوت وكارهای انجام گرفته باهرتكنیك بیان شده و طبقه بندی ازآنها ارایه شده است

كلمات كلیدی:

بازیابی متن، تشخیص سرقت علمی – ادبی بیرونی ، سرقت علمی – ادبی، شباهت متون

بررسی روشهای ارزیابی تكنیك های تشخیص سرقت علمی – ادبی درمتون

خلاصه مقاله:

سرقت علمی ادبی یك نوع سوء رفتارعلمی است وبه دلیل دسترسی سریع و اسان به داده ها و اطلاعات ازطریق اسنادالكترونیكی و اینترنت به سرعت درحال افزایش است این مشكل زمانی رخ میدهد كه محتوای اسنادبهصورت غیرقانونی و بدون اجازه و یااستناد اورده شود كه به عنوان سرقت علمی ادبی شناخته میشود یكی ازچالشهی عمده تشخیص سرقت علمی ادبی و كپی غیرقانونی می باشد مطالعه دراین زمینه نشان داد تمركز سیستم های تشخیص سرقت علمی ادبی موجود برتشخیص كپی است اما درتشخیص سرقت علمی ادبی هوشمندانه به هنگام استفاده ازایده ها و بیان آنها با كلمات متفاوت شكست می خورند این مقاله پس ازبیان انواع روشهای سرقت علمی ادبی ومتدهای تشخیص آنها روشهای ارزیابی این سیستم ها را مورد بررسی قرارداده است

كلمات كلیدی:

بازیابی متن، تشخیص سرقت علمی – ادبی، سرقت علمی – ادبی، شباهت متون

بررسی اخلاقی جعل پیشینه در پژوهش

خلاصه مقاله:

در اخلاق پژوهش، آفتی پنهان و در عین حال رایج وجود دارد كه گاهی از آن نیز به انتحال تعبیر می كنند. انتحال در یك معنا، خود را به نحله یا قبیله ای منسوب كردن و مذهبی را برای خود دعوی كردن است. در اخلاق پژوهش وقتی سخن ازانتحال می رود، معمولاً به معنای مشهور آن (سرقت ادبی) می پردازند ولی در این معنی، اندیشه هایی كه از فقر سابقه ی تاریخی رنج می برند، تلاش می كنندبرای خود پیشینه ای مجعول و شجره نامه ای موهوم، دست و پا كنند. این آفت و پنهان تر و بالطبع خطرناك تر از آن است. در این جا از « سرقت ادبی » فراتر از خانه ی دیگران چیزی سرقت نمی شود بلكه مدعی، مال خود را بی اجازه ودزدانه در خانه ی دیگری می گذارد و ادعا می كند كه این مال ،نه به من كه به این خانه ی معروف تعلق دارد. در پژوهش، گاهی مدعی به صد تقویت ادعایخویش، در تلاش است آن را به مكتب یا نویسنده ای معروف و معتبر منتسب كند و یا برای سخن خود سابقه تاریخی جعل كند. سرقتی كه در اینجا رخ می دهد، نه سرقتملككه سرقتمالك است. در سرقت ادبی سارق ادعا می كند این سخن نه مال دیگری كه مال من است ولی سارق در اینجا ادعا می كند این سخن مال من نیست بلكه متعلق فلان چهره ی موجه و بسیارمعروف وریشه دار است. مدعی در این مجال خود را معمولاً به نحله هایی می بندد كه در دسترس نبوده و در جامعه ی مخاطب مدافعی جدی ندارند و كسی از او دلیل و سند نمی خواهد.طبیعی است كه به هنگام مطالبه ی سند مدعی دست به تأویل وتفسیر به رأی می زند. استاد مطهری ، به مصادیقی از این رفتار در نوشتار های ماركسیست ها و گروه های التقاطی اشاره می كند كه با تأویل سخنان برخی ازبزرگان تاریخ برای خود پیشینه می سازند. این عمل غیر اخلاقی با بهره گیری از روحیه ی سنت گرایی مخاطب ، انس به گذشته ، و برای فرار ازفقر سابقه و تقویت روانی خود و تسهیل القاء نظر به مخاطب صورت می گیرد. كذب، فریبمخاطب ، بی توجهی به حقوق معنوی غیر، استفاده از موقعیت و آبروی دیگران و ضربه زدن به آن و… از جمله عناوینی هستند كه در درون این مع ضل اخلاقی وجود دارد

كلمات كلیدی:

اخلاق در پژوهش، جعل پیشینه، سرقت ادبی، انتحال

ارائه یك روش اتوماتیك جهت تشخیص پلاگاریسم (Plagiarism)

خلاصه مقاله:

دسترسی آسانی كه اینترنت به مقادیر گسترده اطلاعات الكترونیكی فراهم آورده باعث شده پلاگاریسم متن بخصوص در اسناد دانشگاهی و موسسات علمی و پژوهشی به یك نگرانی عمده تبدیل شود. بنابراین مشكلات و ناهنجاری های حاصل از پلاگاریسم متن دو زبانه یا افزایش روزافزون حجم اطلاعات در اینترنت باعث شده تا با روش اتوماتیك تشخیص داده شوند، روش های تشخیص پیشنهاد شده بیشتر برای تشخیص پلاگاریسم دو زبانه انگلیسی یا اسپانیایی، بنگالی، آلمانی، فرانسوی و ویتنامی است. در این مقاله روشی پیشنهاد شده كه بر اساس وابستگی كلی محتویات متن و با بكارگیری مدل فضای بردار (vsm) بطور اتوماتیك می توان پلاگاریسم دو زبانه (انگلیسی – فارسی) را تشخیص داد. روش پس از پیاده سازی با استفاده از متون آزمایشی یا معیار دقت، یادآوری و قابلیت اطمینان با استفاده از معیار FB مورد ارزیابی قرار گرفت كه نتایج حاصله نشان داد روش پیشنهادی با معیار دقت 0.88 و قابلیت اطمینان 0.91 می تواند پلاگاریسم متن دو زبانه (انگلیسی – فارسی) را تشخیص دهد.

كلمات كلیدی:

پلاگاریسم، تشخیص پلاگاریستم متن دو زبانه، تحلیل شباهت، تحلیل مورفولوژیك، مدل فضای برداری (vsm)

روشهای تشخیص اتوماتیك پلاگاریسم متن دوزبانه

خلاصه مقاله:

دسترسی آسانی كه اینترنت به مقادیرگسترده اطلاعات الكترونیكی فراهم اورده باعث شده تاپلاگاریسم اسناددانشگاهی به یك نگرانی عمده برای دانشگاه ها باشد تقریبا همه اطلاعات موجود دراینترنت یا به زبان بومی كاربرویابه یك زبان غیربومی است كه به راحتی میتوان اطلاعات نویسندگان دیگر را به زبان بومی ترجمه واستفاده نمود پلاگاریسم مانند سایرجرائم الكترونیكی هكرها ویروسها بعنوان یك چالش دردنیای مجازی ورو به رشد است بنابراین مشكلات ناهنجاریهای حاصل ازپلاگاریسم باعث شده تا محققان به فكرراه حلهای علمی جهت تشخیص پیشگیری ومقابله با بروز این جرائم باشند وبراین اساس دركشورهای مختلف تحقیقات بنیادی وكاربردی بسیاری درموضوع پلاگاریسم انجام شده اما دركشورما به این موضوع بخصوص درزمینه تشخیص اتوماتیك پلاگاریسم دوزبانه تحقیقاتی انجام نشده دراین تحقیق به بررسی انواع روشهای تشخیص پلاگاریسم دوزبانه پرداخته شده است

كلمات كلیدی:

تشخیص پلاگاریسم دوزبانه، تحلیل محتوی، تحلیل اطلاعات آماری، تحلیل شباهت، بازیابی اطلاعات

بررسی روشهای محاسباتی میزان شباهت میان جملات و متون

خلاصه مقاله:

امروزه با توجه به افزایش حجم اطلاعات و مستندات متنی در زمینه های مختلف، دسترسی سریع به اطلاعات مورد نظر برای هر فرد از اهمیت ویژه ای برخوردار است. از این رو علاوه بر تكنیك های بازیابی اطلاعات، تكنیك های خلاصه سازی و دسته بندی خودكار متون می تواند كمك مؤثری در افزایش سرعت دسترسی كاربران به اسناد مورد نظرشان باشد. همچنین در دهه اخیر در حیطه های علمی و ادبی، دستبرد علمی رشد زیادی داشته است كه هم بر خلاف اصول اخلاقی و اهداف علمی است و هم سبب افزونگی داده میشود، بنابراین لزوم ابزارها و تكنیك های تشخیص آن امری مبرهن است. در این تحقیق مروری داریم بر روش های محاسباتی كه در تشخیص عبارات، جملات و متون مشابه در زبان های طبیعی به كار می روند.

كلمات كلیدی:

شباهت متون، یادگیری ماشین، دسته بندی متون، طبقه بندی متون، پردازش زبان های طبیعی

ارائه روشی جدید برای محاسبه تشابه معنایی

خلاصه مقاله:

توسعه وب معنایی در چند سال گذشته و نقش هستان شناسیها به عنوان چهارچوب اصلی آن، توجه زیادی را به هستانشناسیها و مسائل مربوطه به این مسئله در جوامع علمی در پی داشته اس ت. توسعه وب معنایی وابسته به توسعه روشها و الگوریتم هایی است كه ساخت هستان شناسی را بهبود میدهند. با توجه به اینكه یادگیری طبقه بندی یكی از مراحل اصلی یادگیری هستان شناسی است و اندازه گیری تشابه معنایی كلمات یك زمینهتحقیقاتی بسیار مهم در پردازش زبان طبیع ی، بازیابی هوشمند، خوشه بندی و دسته بندی اسناد و غیره می باشد، سعی میشود تا یك معیار كامل برای اندازهگیری تشابه معنایی ارائه گردد. از آنجا كه اكثر روشهای پردازش متن با چالش خلوتی داده روبه رو هستند، علاوه بر اسناد متنی، از وب نیز به عنوان بزرگترین و كا ملترین انباره متنی برای حل این مشكل استفاده خواهد شد. روش پیشنهادی، بر استفادهی همزمان از وب، همرخدادی در اسناد متنی و هستان شناسیWordNetمبتنی است . برای ارزیابی معیار تشابه پیشنهادی، از طبقه بندیهای رایج در وب مثل yahoo یا Dmoz بهره خواهیم برد

كلمات كلیدی:

هستانشناسی، طبقهبندی، تشابه معنایی ، وبمعنایی ، همرخدادی

بهبود روش رفع ابهام معنایی بر پایه شباهت مفهومی متون

خلاصه مقاله:

یكی از مسائل مهم و اساسی در فرآیند و روند ترجمه ماشینی، مشخص كردن معنای كلمه (WSD) است كه به عنوان انتخاب معنی صحیح كلمه چند معنایی تعریف شده است. روش های دیگر یادیگری نظارت شده، معمولا برای حل این مشكل استفاده می شوند. كار مشخص كردن معنای كلمه با استفاده از اسناد ترجمه شده (به عنوان داده ها آموزشی و رابطه دو زبان) است. در این مقاله ما روش یادیگری نظارت شده را برای WSD ارائه می دهیم كه بر اساس فاصله اقلیدسی و شباهت cosine است. به عنوان اولین منبع، ما به دو مجموعه از ویژگی ها را استخراج می كنیم. مجموعه كلماتی كه در متن تكرار می شوند و كلماتی كه كلمه مبهم را احاطه می كنند. ما نتایج ارزشیابی برنامه های پیش بینی شده را ارائه خواهیم داد و تاثیرات سنجش استراتژی های پیشنهاد شده را مشخص خواهیم كرد. نتایج حاصله در مقایسه با روش های موجود در این مقاله نوید بخش هستند.

كلمات كلیدی:

ترجمه ماشینی، روش های نظارت شده، فاصله اقلیدسی، شباهت cosine

10. تركیب خوشه بندی، معیار شباهت فازی و الگوریتم بهینه سازی اجتماع ذرات برای طبقه بندی بر مبنای یادگیری جمعی

خلاصه مقاله:

در این مقاله یك روش جدید برای ایجاد طبقه بندی مبتنی بر گروه با استفاده از خوشه بندی و یك معیار شباهت فازی ارائه شده است. در روش پیشنهادی ابتدا با استفاده از الگوریتم خوشه بندی مركز خوشه ها محاسبه می شود. سپس با استفاده از یك معیار شباهت فازی میزان شباهت نمونه ها به مركز خوشه ها محاسبه می شود. متناظرظ با هر خوشه یك طبقه بند آموزش داده می شود كه داده های آموزشی هر طبقه بند با استفاده از یك روش نمونه برداری با جایگذاری وزن دار با توجه به میزان شباهت نمونه ها به مركز آن خوشه ایجاد می شوند به منظور تنظیم شعاع گستردگی هر خوشه از الگوریتم بهینه سازی اجتماع ذرات استفاده شده است برای پیش بینی نمونه جدید تصمیم های طبقه بندی ها با استفاده از روش رای اكثریت وزن دار تركیب می شوند نتایج تجربی نشان می دهد كه استفاده از خوشه بندی به همراه معیار شباهت فازی برای ایجاد زیرمجموعه های آموزشی با همپوشانی مناسب، در هنگام ساخت طبقه بند مبتنی بر یادگیری جمعی موثر است.

كلمات كلیدی:

طبقه بند مبتنی بر یادگیری جمعی، خوشه بندی، معیار شباهت فازی.

11. كشف سرقت ادبی در متون فارسی به كمك الگوریتمهای اثرانگشت (موجود نیست)

خلاصه مقاله:

سرقتادبی یكی از معضلات بزرگ در عصر ارتباطات است. در خیلی لز زبانها از جمله زبان انگلیسی این مساله به طور جدی مورد اهمیت بوده و ابزارهای قدرتمندی برای جلوگیری از این مساله تهیه شده است، اما متاسفانه تاكنون ابزاری برای كشف این مساله در زبان فارسیطراحی نشده است. این مقاله به كشف سرقت ادبی در متون فارسی براساس الگوریتمهای اثرانگشت میپردازد. الگوریتمهای اثرانگشت به خاطر ایجاد ویژگیهای فشرده و صرفا مقایسه این ویژگیها بین اسناد اصل و مشكوك، سرعت بالایی در كشف سرقت ادبی دارند. به منظور افزایش دقت و سرعت كشف سرقت ادبی، میبایست قبل از بكارگیری الگوریتم عملیات پیشپردازش شامل: حذف تگهایhtmlنسخه اینترنتی مقاله، جداسازی كلمات، یكسانسازی، جایگزینی اعداد، حذف واژههای عمومی، و ریشهیابی روی متن صورت گیرد. دراین مقاله چهار الگوریتمRareChunk و SPEX ،Winnowing ،SimHashبررسی و از نظر كارایی در زبان فارسی با یكدیگر مقایسه میشوند. پیادهسازی این الگوریتم- ها روی سیصد مقالات ثبت شده در پایگاه داده نور با موضوعات هنر، تاریخ و روانشناسی، نتایج قابل قبولی را نشان میدهد.

كلمات كلیدی:

سرقت ادبی، اثرانگشت ,RareChunk ، SPEX ،winnowing ، simHash

12. مطالعه و بررسی اثر پسوند و پیشوند در شباهت معنایی جملات زبان فارسی با هدف كاربردی در سیستمهای بازیابی اطلاعات (موجود نیست)

خلاصه مقاله:

امروزه حجم زیادی از اطلاعات در شبكه ارتباطی جهانی وجود دارد پیدا كرده داده های مورد نظر كاربر روی وب در یك روش بهنگام و سودمند یكی از مسائل چالش برانگیز است یكی از روشهای موثر برای كاهش و سازماندهی حجم زیاد داده ها پیدا كردن مستندات متشابه و دسته بندی آنهاست این مقاله تكنیكی را برای حذف وندها و تاثیر آن برروی تشخیص مستندات متشابه ارائه كرده است این روش با بررسی وندها و استثنائات آنها در زبان فارسی حدود 300 وند و تركیبات آنها را استخراج و با حذف آنها از متن نتایج بهتری را برای مشابهت یابی متون فارسی بدست اورده است ارزیابی های ما نشان دادند كه حذف وندها از متون فارسی روشهای تشابه متن را بهبود میدهد

كلمات كلیدی:

بازیابی اطلاعات، تشابه متن، ریخت شناسی، وندها، زبان فارسی

تمامی مقالات فوق در یک فایل بصورت فشرده قابل دانلود می باشد….

universitydatainfo{ @ } yahoo.com

09359529058

کاربر گرامی

برای دانلود فایل های مورد نظرتان بایستی بر روی دکمه "افزودن به سبد خرید" کلیک نمایید .

پس از چند ثانیه ، فایل مورد نظر شما به سبد خریدتان اضافه گردیده و این دکمه تبدیل به دکمه "پرداخت" خواهد شد.

با کلیلک بر روی دکمه "پرداخت" ، وارد صفحه پرداخت خواهید شد .

با وارد کردن اطلاعات و ایمیل خود ، فایل مورد نظر به ایمیل شما ارسال گردیده و همچنین لینک دانلود فایل بلافاصله برایتان به نمایش درخواهد آمد.

– قابل پرداخت با تمام کارتهای بانکی + رمز دوم

– پشتیبانی سایت ۰۹۳۵۹۵۲۹۰۵۸ – Info@tnt3.ir – universitydatainfo@yahoo.com