دوستان عزیز برای پیدا کردن سریع مطالب مورد نظر خود، می توانید از قسمت جستجوی سریع در سایت، یک یا چند کلمه کلیدی مورد نظر خود را جستجو نمایید.
یا اینکه بر روی دو آیکون سبز رنگ "طبقه بندی موضوعات" یا "جستجوی کلمات کلیدی" در سمت راست و چپ موجود در بالای سایت کلیک نمایید...
در صورت بروز مشکل در پرداخت الکترونیکی؛ میتونید ایمیلی ، پیامکی، تلفنی یا تلگرامی بگید تا فایلتون براتون ارسال بشه.
كشف سرقت ادبی - تشخیص پلاگاریسم (Plagiarism) | تعاونی نیرومندسازی تحقیقات
طبقه بندی موضوعات
جستجوی کلمات کلیدی
یکشنبه , ۲۱ آذر ۱۳۹۵
آخرین مطالب
خانه -> پردازش متن -> سرقت ادبی -> کشف سرقت ادبی – تشخیص پلاگاریسم (Plagiarism)

کشف سرقت ادبی – تشخیص پلاگاریسم (Plagiarism)

 

1. کشف سرقت ادبی در متون فارسی با کمک الگوریتم SimHash

خلاصه مقاله:

دسترسی آسان به وب، پایگاه داده های بزرگ و به طور کلی ارتباطات از راه دور باعث شده که سرقت ادبی به یک مشکل بزرگ برای ناشران، محققان و موسسات آموزشی تبدیل شود. در زبان انگلیسی این مسئله به طور جدی مورد اهمیت بوده و ابزارهای قدرتمندی برای جلوگیری از این مسئله تهیه شده است، اما متاسفانهتاکنون در این باره به صورت جدی در زبان فارسی به آن پرداخته نشده است. این مقاله به بررسی سرقت ادبی در متون فارسی بر اساس الگوریتم simhash می پردازد. الگوریتم simhash از دسته الگوریتم های اثر انگشت است. ویژگی اصلی الگوریتم های اثر انگشت، سرعت بالای آنها در کشف سرقت ادبی است. قبل از بکارگیری الگوریتم، می بایست عملیات پیش پردازش شامل: حذف تگ های نسخه اینترنتی مقاله، جداسازی کلمات، یکسان سازی، جایگزینی اعداد, حذف واژه های عمومیو ریشه یابی روی متون صورت گیرد. در این مقاله simhash و shingling بررسی و با یکدیگر مقایسه می شوند. پیاده سازی این دو الگوریتم روی یک مجموعه بزرگی از مقالات ثبت شده در پایگاه داده نور، نتایج قابل قبولی را نشان می دهد

کلمات کلیدی:

سرقت ادبی، اثر انگشت، فاصله همینگ، shingling، simHash

  1. بررسی روشهای تشخیص سرقت علمی – ادبی بیرونی درمحیط تک زبانه

خلاصه مقاله:

تشخیص سرقت علمی ادبی میتواند نقش مهمی رادرتشخیص سرقت ایده ها درمقالات مجلات و وب سایت های اینترنتی داشته باشد چک کردن دستی آن درحال حاضرباتوجه به وجود حجم بالای منابع دیجیتال بسیاردشواروغیرممکن است تکنیکهای مختلفی برای تشخیص آن بصورت نرم افزاری وجود دارد که دراین مقاله روشهای تشخیص سرقت علمی ادبی بیرونی به همراه نقاط ضعف وقوت وکارهای انجام گرفته باهرتکنیک بیان شده و طبقه بندی ازآنها ارایه شده است

کلمات کلیدی:

بازیابی متن، تشخیص سرقت علمی – ادبی بیرونی ، سرقت علمی – ادبی، شباهت متون

  1. بررسی روشهای ارزیابی تکنیک های تشخیص سرقت علمی – ادبی درمتون

خلاصه مقاله:

سرقت علمی ادبی یک نوع سوء رفتارعلمی است وبه دلیل دسترسی سریع و اسان به داده ها و اطلاعات ازطریق اسنادالکترونیکی و اینترنت به سرعت درحال افزایش است این مشکل زمانی رخ میدهد که محتوای اسنادبهصورت غیرقانونی و بدون اجازه و یااستناد اورده شود که به عنوان سرقت علمی ادبی شناخته میشود یکی ازچالشهی عمده تشخیص سرقت علمی ادبی و کپی غیرقانونی می باشد مطالعه دراین زمینه نشان داد تمرکز سیستم های تشخیص سرقت علمی ادبی موجود برتشخیص کپی است اما درتشخیص سرقت علمی ادبی هوشمندانه به هنگام استفاده ازایده ها و بیان آنها با کلمات متفاوت شکست می خورند این مقاله پس ازبیان انواع روشهای سرقت علمی ادبی ومتدهای تشخیص آنها روشهای ارزیابی این سیستم ها را مورد بررسی قرارداده است

کلمات کلیدی:

بازیابی متن، تشخیص سرقت علمی – ادبی، سرقت علمی – ادبی، شباهت متون

  1. بررسی اخلاقی جعل پیشینه در پژوهش

خلاصه مقاله:

در اخلاق پژوهش، آفتی پنهان و در عین حال رایج وجود دارد که گاهی از آن نیز به انتحال تعبیر می کنند. انتحال در یک معنا، خود را به نحله یا قبیله ای منسوب کردن و مذهبی را برای خود دعوی کردن است. در اخلاق پژوهش وقتی سخن ازانتحال می رود، معمولاً به معنای مشهور آن (سرقت ادبی) می پردازند ولی در این معنی، اندیشه هایی که از فقر سابقه ی تاریخی رنج می برند، تلاش می کنندبرای خود پیشینه ای مجعول و شجره نامه ای موهوم، دست و پا کنند. این آفت و پنهان تر و بالطبع خطرناک تر از آن است. در این جا از « سرقت ادبی » فراتر از خانه ی دیگران چیزی سرقت نمی شود بلکه مدعی، مال خود را بی اجازه ودزدانه در خانه ی دیگری می گذارد و ادعا می کند که این مال ،نه به من که به این خانه ی معروف تعلق دارد. در پژوهش، گاهی مدعی به صد تقویت ادعایخویش، در تلاش است آن را به مکتب یا نویسنده ای معروف و معتبر منتسب کند و یا برای سخن خود سابقه تاریخی جعل کند. سرقتی که در اینجا رخ می دهد، نه سرقتملککه سرقتمالک است. در سرقت ادبی سارق ادعا می کند این سخن نه مال دیگری که مال من است ولی سارق در اینجا ادعا می کند این سخن مال من نیست بلکه متعلق فلان چهره ی موجه و بسیارمعروف وریشه دار است. مدعی در این مجال خود را معمولاً به نحله هایی می بندد که در دسترس نبوده و در جامعه ی مخاطب مدافعی جدی ندارند و کسی از او دلیل و سند نمی خواهد.طبیعی است که به هنگام مطالبه ی سند مدعی دست به تأویل وتفسیر به رأی می زند. استاد مطهری ، به مصادیقی از این رفتار در نوشتار های مارکسیست ها و گروه های التقاطی اشاره می کند که با تأویل سخنان برخی ازبزرگان تاریخ برای خود پیشینه می سازند. این عمل غیر اخلاقی با بهره گیری از روحیه ی سنت گرایی مخاطب ، انس به گذشته ، و برای فرار ازفقر سابقه و تقویت روانی خود و تسهیل القاء نظر به مخاطب صورت می گیرد. کذب، فریبمخاطب ، بی توجهی به حقوق معنوی غیر، استفاده از موقعیت و آبروی دیگران و ضربه زدن به آن و… از جمله عناوینی هستند که در درون این مع ضل اخلاقی وجود دارد

کلمات کلیدی:

اخلاق در پژوهش، جعل پیشینه، سرقت ادبی، انتحال

  1. ارائه یک روش اتوماتیک جهت تشخیص پلاگاریسم (Plagiarism)

خلاصه مقاله:

دسترسی آسانی که اینترنت به مقادیر گسترده اطلاعات الکترونیکی فراهم آورده باعث شده پلاگاریسم متن بخصوص در اسناد دانشگاهی و موسسات علمی و پژوهشی به یک نگرانی عمده تبدیل شود. بنابراین مشکلات و ناهنجاری های حاصل از پلاگاریسم متن دو زبانه یا افزایش روزافزون حجم اطلاعات در اینترنت باعث شده تا با روش اتوماتیک تشخیص داده شوند، روش های تشخیص پیشنهاد شده بیشتر برای تشخیص پلاگاریسم دو زبانه انگلیسی یا اسپانیایی، بنگالی، آلمانی، فرانسوی و ویتنامی است. در این مقاله روشی پیشنهاد شده که بر اساس وابستگی کلی محتویات متن و با بکارگیری مدل فضای بردار (vsm) بطور اتوماتیک می توان پلاگاریسم دو زبانه (انگلیسی – فارسی) را تشخیص داد. روش پس از پیاده سازی با استفاده از متون آزمایشی یا معیار دقت، یادآوری و قابلیت اطمینان با استفاده از معیار FB مورد ارزیابی قرار گرفت که نتایج حاصله نشان داد روش پیشنهادی با معیار دقت ۰.۸۸ و قابلیت اطمینان ۰.۹۱ می تواند پلاگاریسم متن دو زبانه (انگلیسی – فارسی) را تشخیص دهد.

کلمات کلیدی:

پلاگاریسم، تشخیص پلاگاریستم متن دو زبانه، تحلیل شباهت، تحلیل مورفولوژیک، مدل فضای برداری (vsm)

  1. روشهای تشخیص اتوماتیک پلاگاریسم متن دوزبانه

خلاصه مقاله:

دسترسی آسانی که اینترنت به مقادیرگسترده اطلاعات الکترونیکی فراهم اورده باعث شده تاپلاگاریسم اسناددانشگاهی به یک نگرانی عمده برای دانشگاه ها باشد تقریبا همه اطلاعات موجود دراینترنت یا به زبان بومی کاربرویابه یک زبان غیربومی است که به راحتی میتوان اطلاعات نویسندگان دیگر را به زبان بومی ترجمه واستفاده نمود پلاگاریسم مانند سایرجرائم الکترونیکی هکرها ویروسها بعنوان یک چالش دردنیای مجازی ورو به رشد است بنابراین مشکلات ناهنجاریهای حاصل ازپلاگاریسم باعث شده تا محققان به فکرراه حلهای علمی جهت تشخیص پیشگیری ومقابله با بروز این جرائم باشند وبراین اساس درکشورهای مختلف تحقیقات بنیادی وکاربردی بسیاری درموضوع پلاگاریسم انجام شده اما درکشورما به این موضوع بخصوص درزمینه تشخیص اتوماتیک پلاگاریسم دوزبانه تحقیقاتی انجام نشده دراین تحقیق به بررسی انواع روشهای تشخیص پلاگاریسم دوزبانه پرداخته شده است

کلمات کلیدی:

تشخیص پلاگاریسم دوزبانه، تحلیل محتوی، تحلیل اطلاعات آماری، تحلیل شباهت، بازیابی اطلاعات

  1. بررسی روشهای محاسباتی میزان شباهت میان جملات و متون

خلاصه مقاله:

امروزه با توجه به افزایش حجم اطلاعات و مستندات متنی در زمینه های مختلف، دسترسی سریع به اطلاعات مورد نظر برای هر فرد از اهمیت ویژه ای برخوردار است. از این رو علاوه بر تکنیک های بازیابی اطلاعات، تکنیک های خلاصه سازی و دسته بندی خودکار متون می تواند کمک مؤثری در افزایش سرعت دسترسی کاربران به اسناد مورد نظرشان باشد. همچنین در دهه اخیر در حیطه های علمی و ادبی، دستبرد علمی رشد زیادی داشته است که هم بر خلاف اصول اخلاقی و اهداف علمی است و هم سبب افزونگی داده میشود، بنابراین لزوم ابزارها و تکنیک های تشخیص آن امری مبرهن است. در این تحقیق مروری داریم بر روش های محاسباتی که در تشخیص عبارات، جملات و متون مشابه در زبان های طبیعی به کار می روند.

کلمات کلیدی:

شباهت متون، یادگیری ماشین، دسته بندی متون، طبقه بندی متون، پردازش زبان های طبیعی

  1. ارائه روشی جدید برای محاسبه تشابه معنایی

خلاصه مقاله:

توسعه وب معنایی در چند سال گذشته و نقش هستان شناسیها به عنوان چهارچوب اصلی آن، توجه زیادی را به هستانشناسیها و مسائل مربوطه به این مسئله در جوامع علمی در پی داشته اس ت. توسعه وب معنایی وابسته به توسعه روشها و الگوریتم هایی است که ساخت هستان شناسی را بهبود میدهند. با توجه به اینکه یادگیری طبقه بندی یکی از مراحل اصلی یادگیری هستان شناسی است و اندازه گیری تشابه معنایی کلمات یک زمینهتحقیقاتی بسیار مهم در پردازش زبان طبیع ی، بازیابی هوشمند، خوشه بندی و دسته بندی اسناد و غیره می باشد، سعی میشود تا یک معیار کامل برای اندازهگیری تشابه معنایی ارائه گردد. از آنجا که اکثر روشهای پردازش متن با چالش خلوتی داده روبه رو هستند، علاوه بر اسناد متنی، از وب نیز به عنوان بزرگترین و کا ملترین انباره متنی برای حل این مشکل استفاده خواهد شد. روش پیشنهادی، بر استفادهی همزمان از وب، همرخدادی در اسناد متنی و هستان شناسیWordNetمبتنی است . برای ارزیابی معیار تشابه پیشنهادی، از طبقه بندیهای رایج در وب مثل yahoo یا Dmoz بهره خواهیم برد

کلمات کلیدی:

هستانشناسی، طبقهبندی، تشابه معنایی ، وبمعنایی ، همرخدادی

  1. بهبود روش رفع ابهام معنایی بر پایه شباهت مفهومی متون

خلاصه مقاله:

یکی از مسائل مهم و اساسی در فرآیند و روند ترجمه ماشینی، مشخص کردن معنای کلمه (WSD) است که به عنوان انتخاب معنی صحیح کلمه چند معنایی تعریف شده است. روش های دیگر یادیگری نظارت شده، معمولا برای حل این مشکل استفاده می شوند. کار مشخص کردن معنای کلمه با استفاده از اسناد ترجمه شده (به عنوان داده ها آموزشی و رابطه دو زبان) است. در این مقاله ما روش یادیگری نظارت شده را برای WSD ارائه می دهیم که بر اساس فاصله اقلیدسی و شباهت cosine است. به عنوان اولین منبع، ما به دو مجموعه از ویژگی ها را استخراج می کنیم. مجموعه کلماتی که در متن تکرار می شوند و کلماتی که کلمه مبهم را احاطه می کنند. ما نتایج ارزشیابی برنامه های پیش بینی شده را ارائه خواهیم داد و تاثیرات سنجش استراتژی های پیشنهاد شده را مشخص خواهیم کرد. نتایج حاصله در مقایسه با روش های موجود در این مقاله نوید بخش هستند.

کلمات کلیدی:

ترجمه ماشینی، روش های نظارت شده، فاصله اقلیدسی، شباهت cosine

۱۰. ترکیب خوشه بندی، معیار شباهت فازی و الگوریتم بهینه سازی اجتماع ذرات برای طبقه بندی بر مبنای یادگیری جمعی

خلاصه مقاله:

در این مقاله یک روش جدید برای ایجاد طبقه بندی مبتنی بر گروه با استفاده از خوشه بندی و یک معیار شباهت فازی ارائه شده است. در روش پیشنهادی ابتدا با استفاده از الگوریتم خوشه بندی مرکز خوشه ها محاسبه می شود. سپس با استفاده از یک معیار شباهت فازی میزان شباهت نمونه ها به مرکز خوشه ها محاسبه می شود. متناظرظ با هر خوشه یک طبقه بند آموزش داده می شود که داده های آموزشی هر طبقه بند با استفاده از یک روش نمونه برداری با جایگذاری وزن دار با توجه به میزان شباهت نمونه ها به مرکز آن خوشه ایجاد می شوند به منظور تنظیم شعاع گستردگی هر خوشه از الگوریتم بهینه سازی اجتماع ذرات استفاده شده است برای پیش بینی نمونه جدید تصمیم های طبقه بندی ها با استفاده از روش رای اکثریت وزن دار ترکیب می شوند نتایج تجربی نشان می دهد که استفاده از خوشه بندی به همراه معیار شباهت فازی برای ایجاد زیرمجموعه های آموزشی با همپوشانی مناسب، در هنگام ساخت طبقه بند مبتنی بر یادگیری جمعی موثر است.

کلمات کلیدی:

طبقه بند مبتنی بر یادگیری جمعی، خوشه بندی، معیار شباهت فازی.

۱۱. کشف سرقت ادبی در متون فارسی به کمک الگوریتمهای اثرانگشت (موجود نیست)

خلاصه مقاله:

سرقتادبی یکی از معضلات بزرگ در عصر ارتباطات است. در خیلی لز زبانها از جمله زبان انگلیسی این مساله به طور جدی مورد اهمیت بوده و ابزارهای قدرتمندی برای جلوگیری از این مساله تهیه شده است، اما متاسفانه تاکنون ابزاری برای کشف این مساله در زبان فارسیطراحی نشده است. این مقاله به کشف سرقت ادبی در متون فارسی براساس الگوریتمهای اثرانگشت میپردازد. الگوریتمهای اثرانگشت به خاطر ایجاد ویژگیهای فشرده و صرفا مقایسه این ویژگیها بین اسناد اصل و مشکوک، سرعت بالایی در کشف سرقت ادبی دارند. به منظور افزایش دقت و سرعت کشف سرقت ادبی، میبایست قبل از بکارگیری الگوریتم عملیات پیشپردازش شامل: حذف تگهایhtmlنسخه اینترنتی مقاله، جداسازی کلمات، یکسانسازی، جایگزینی اعداد، حذف واژههای عمومی، و ریشهیابی روی متن صورت گیرد. دراین مقاله چهار الگوریتمRareChunk و SPEX ،Winnowing ،SimHashبررسی و از نظر کارایی در زبان فارسی با یکدیگر مقایسه میشوند. پیادهسازی این الگوریتم- ها روی سیصد مقالات ثبت شده در پایگاه داده نور با موضوعات هنر، تاریخ و روانشناسی، نتایج قابل قبولی را نشان میدهد.

کلمات کلیدی:

سرقت ادبی، اثرانگشت ,RareChunk ، SPEX ،winnowing ، simHash

۱۲. مطالعه و بررسی اثر پسوند و پیشوند در شباهت معنایی جملات زبان فارسی با هدف کاربردی در سیستمهای بازیابی اطلاعات (موجود نیست)

خلاصه مقاله:

امروزه حجم زیادی از اطلاعات در شبکه ارتباطی جهانی وجود دارد پیدا کرده داده های مورد نظر کاربر روی وب در یک روش بهنگام و سودمند یکی از مسائل چالش برانگیز است یکی از روشهای موثر برای کاهش و سازماندهی حجم زیاد داده ها پیدا کردن مستندات متشابه و دسته بندی آنهاست این مقاله تکنیکی را برای حذف وندها و تاثیر آن برروی تشخیص مستندات متشابه ارائه کرده است این روش با بررسی وندها و استثنائات آنها در زبان فارسی حدود ۳۰۰ وند و ترکیبات آنها را استخراج و با حذف آنها از متن نتایج بهتری را برای مشابهت یابی متون فارسی بدست اورده است ارزیابی های ما نشان دادند که حذف وندها از متون فارسی روشهای تشابه متن را بهبود میدهد

کلمات کلیدی:

بازیابی اطلاعات، تشابه متن، ریخت شناسی، وندها، زبان فارسی

 

 

تمامی مقالات فوق در یک فایل بصورت فشرده قابل دانلود می باشد….

universitydatainfo{ @ } yahoo.com

09359529058

کاربر گرامی

برای دانلود فایل های مورد نظرتان بایستی بر روی دکمه "افزودن به سبد خرید" کلیک نمایید .

پس از چند ثانیه ، فایل مورد نظر شما به سبد خریدتان اضافه گردیده و این دکمه تبدیل به دکمه "پرداخت" خواهد شد.

با کلیلک بر روی دکمه "پرداخت" ، وارد صفحه پرداخت خواهید شد .

با وارد کردن اطلاعات و ایمیل خود ، فایل مورد نظر به ایمیل شما ارسال گردیده و همچنین لینک دانلود فایل بلافاصله برایتان به نمایش درخواهد آمد.

– قابل پرداخت با تمام کارتهای بانکی + رمز دوم

– پشتیبانی سایت ۰۹۳۵۹۵۲۹۰۵۸ – Info@tnt3.ir – universitydatainfo@yahoo.com




سفارش ترجمه متون عمومی و تخصصیفروشگاه اینترنتی کتاب - خرید آنلاین کتاب - دانلود کتاب الکترونیکی

جوابی بنویسید

ایمیل شما نشر نخواهد شد

3 × 1 =

شما می‌توانید از این دستورات HTML استفاده کنید: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>


This site is using the Seo Wizard plugin by http://seo.uk.net/