Quantcast
Channel: دانلود فایل رایگان
Viewing all articles
Browse latest Browse all 46175

مقاله در مورد مقايسه ويژگي هاي مبتني بر فيلترهاي گابور و ارايه روشي جديد براي تعيين هويت نويسنده بر اساس دست نوشته فارسي

$
0
0
 nx دارای 19 صفحه می باشد و دارای تنظیمات در microsoft word می باشد و آماده پرینت یا چاپ است فایل ورد nx  کاملا فرمت بندی و تنظیم شده در استاندارد دانشگاه  و مراکز دولتی می باشد. این پروژه توسط مرکز nx2 آماده و تنظیم شده است توجه : در صورت  مشاهده  بهم ريختگي احتمالي در متون زير ،دليل ان کپي کردن اين مطالب از داخل فایل ورد مي باشد و در فايل اصلي nx،به هيچ وجه بهم ريختگي وجود ندارد بخشی از متن nx : مقایسه ویژگی های مبتنی بر فیلترهای گابور و ارایه روشی جدید برای تعیین هویت نویسنده بر اساس دست نوشته فارسی چكیدهاغلب تحقیقات انجام شده در زمینه تعیین هویت نویسنده بر روی زبان انگلیسی متمركز بوده و تاكنون مطالعاتی در زمینه متون دستنویس فارسی گزارش نشده است. بنابراین در این مقاله روشی برای تعیین هویت نویسنده بر اساس متن دست نویس فارسی پیشنهاد شده كه به صورت برون خط و مستقل از متن انجام می شود. بر اساس ایده مطرح شده در مطالعات قبلی، در روش پیشنهادی تصویر متن دست نویس به صورت یك بافت در نظر گرفته شده و پس از مرحله نرمال سازی، با كمك فیلترهای گابور ویژگی های متن استخراج می شود. ویژگی روش پیشنهادی استفاده از بانك فیلتری است كه با ساختار متون دستنویس فارسی و همچنین سیستم بینایی تناسب بیشتری دارد. علاوه بر این روش جدیدی جهت استخراج ویژگیها از خروجی فیلترهای گابور پیشنهاد شده كه مبتنی بر ویژگی انرژی گابور و گشتاورهای هندسی است. همچنین برای اولین بار، روشهای مختلف استخراج ویژگی از خروجی فیلترهای گابور را برای مسئله تعیین هویت نویسنده مورد بررسی كامل قرار داده ایم. تمامی این روشها به همراه دو روش ماتریس هم وقوعی و روش Said كه مبتنی بر فیلترهای گابور می باشد و برای متون انگلیسی پیشنهاد شده است، را پیاده سازی نموده ایم. نتایج اجرای روشها بر روی تصاویر دستخط 40 نفر كه هیچ محدودیتی در نوع دستخط آنها وجود ندارد، نشان می دهد كه روش پیشنهادی از كارایی بالاتری برای متون دستنویس فارسی برخوردار است.واژه های كلیدی: تعیین هویت نویسنده، دست نوشته، فیلتر گابور چند كانالی، ماتریس هم وقوعی1- مقدمهدر بین ویژگی های رفتاری دستخط افراد به راحتی قابل حصول است و علاوه بر این مطالعات نشان می دهند كه افراد مختلف دارای دستخط های متفاوتی نیز می باشند. به همین دلیل تعیین هویت افراد به كمك متون دست نویس آنها، به عنوان یك موضوع تحقیقاتی در طی سالهای اخیر مورد توجه قرار گرفته و كاربرد آن در زمینه مسائل امنیتی، حقوقی، كنترل دسترسی به سیستمها و فعالیتهای مالی می باشد. هرچند كه تعیین هویت بر اساس دستخط در مقایسه با ویژگیهای فیزیولوژیكی مثل الگوی عنبیه و اثر انگشت از دقت كمتری برخوردار است، اما این مسئله در جاهایی كه اطلاعاتی بجز دستخط در دسترس نمی باشد و یا بعنوان مكملی جهت كارایی سیستمهای امنیتی و یاری رساندن به افراد خط شناس، كاربرد مشهودتری دارد. در مسئله تعیین هویت هدف این است كه با داشتن یك متن دستنویس، هویت نویسنده آن را مشخص كنیم. هدف این مقاله این است كه با تركیب روشهای پردازش تصویر و شناسایی الگو راه حلی ماشینی برای تعیین هویت نویسنده ارایه دهد. این روشها را می توان به دو دسته كلی زیر تقسیم كرد:1- روشهای برون خط (off line): در این روشها فقط تصویر متن دستنویس در دسترس است و ویژگیها با توجه به كل تصویر یا ساختار كلمه ها و نویسه ها استخراج می شوند. در این روشها بسیاری از اطلاعات دینامیكی كه مربوط به طرز نوشتن افراد است، از دست می رود و این امر كار را نسبت به روشهای برخط مشكلتر می سازد. روشهای برون خط را می توان به دو گروه كلی وابسته به متن و مستقل از متن نیز دسته بندی كرد. در روشهای وابسته به متن، باید متن ثابتی توسط نویسنده نوشته شود تا بتوان هویت وی را مشخص نمود اما در روشهای مستقل از متن، با استفاده از هر نوع متنی هویت نویسنده آن مشخص می گردد.2- روشهای برخط (on line): در این روشها علاوه بر ویژگیهای برون خط از اطلاعات دینامیكی مثل فشار قلم، ترتیب نوشتن، سرعت نوشتن، فرم ضربه های قلم و غیره نیز استفاده می شود. بنابراین بدلیل داشتن اطلاعات بیشتر، تعیین هویت با دقت بیشتری انجام می شود اما این روشها كاربردهای محدودتری را شامل می شوند.فرض منحصر به فرد بودن دستخط افراد، بصورت علمی توسط Srihari بررسی شده است [2و1]. در این مطالعه 1000 نفر از بین جمعیت چندین ایالت مختلف آمریكا و بر اساس تفاوت سن، نژاد، تحصیلات و جنسیت انتخاب شدند و از آنها خواسته شد كه متن مشخصی را سه مرتبه و بر روی یك كاغذ بدون خط و با خودكار مشكی بنویسند. سپس ویژگیهایی در سطح كل متن، پاراگراف، خط و كلمه از متون دست نویس استخراج شده و با كمك فاصله اقلیدسی تعیین هویت انجام می شود. از جمله كارهای انجام شده در زمینه تعیین هویت نویسنده، می توان به مواردی چون روش مبتنی بر ارزیابی اطلاعات [3]، استفاده از ویژگی كانتور اجزاء متصل [4]، روش مبتنی بر ویژگیهای لبه [5]، كدگذاری هیستوگرام نمای عمودی با كمك مورفولوژی (6) و روش مبتنی بر مدل مخفی می باشند. چون هدف ما ارایه روشی خودكار جهت تعیین هویت نویسنده بوده و محدودیتی برای نوع دستخط های مورد بررسی قرار نداده ایم، بنابراین استفاده از روشهایی كه نیازمند تقطیع خودكار و كامل متن به كلمات و حروف می باشند، مورد نظر نیست. بنابراین در این مقاله با استفاده از یك روش مبتنی بر بافت، متن دستنویس را به صورت تصویر بافت در نظر گرفته و مسئله تعیین هویت نویسنده به مسئله طبقه بندی بافت تبدیل می گردد.2- روش پیشنهادیدر این روش از ایده مطرح شده در [8] استفاده شده و تصویر متن دست نویس بصورت یك بافت در نظر گرفته شده است. برای این منظور ابتدا مراحل نرمال سازی بر روی تصویر متن انجام شده و سپس ویژگیهای متن به كمك بانكی از فیلترهای گابور استخراج می شوند. با كمك این ویژگیها و یك طبقه بندی كننده هویت متن دست نویس ورودی تعیین می گردد. در ادامه به شرح هر یك از این مراحل خواهیم پرداخت.2-1- نرمال سازی تصویرروشهای تحلیل بافت را نمی توان مستقیماً برای تصویر متن دست نویس به كار گرفت و ابتدا باید تصویر را نسبت به تأثیر عواملی مثل فاصله خطوط، كلمات و غیره نرمال سازی نمود تا بلوكی یكنواخت از متن دست نویس مورد نظر حاصل شود. مراحل نرمال سازی تصویر متن عبارتند از:(الف) به منظور استخراج خطوط و كلمات موجود در متن، معمولاً از منحنی نمای نیم رخ تصویر باینری استفاده می شود [9]. در این مقاله ما نسخه ای تغییر یافته از این الگوریتم كه برای تصاویر سطوح خاكستری پیشنهاد شده [10]، را استفاده نموده ایم. ابتدا نمای نیم رخ افقی تصویر محاسبه شده و سپس با یك فیلتر پایین گذر گاسین هموارسازی می شود. هموارسازی ماكزیمم های محلی را حذف نموده و حساسیت به نویز را كاهش می دهد. در شكل 1 تصویر متن دستنویس، منحنی نیم رخ افقی و منحنی هموارسازی شده متناظر با آن را مشاهده می كنیم. در این منحنی قله ها متناظر با فاصله بین خطوط و دره ها متناظر با مركز خطوط متن هستند كه برای یافتن قله ها یا خطوط در متن می توان نقاط صفر در مشتق منحنی را محاسبه نمود. به دلیل خطی بودن كانولوشن، هموارسازی و مشتق گیری را می توان در یك مرحله انجام داد. پس برای یافتن خطوط متن كافی است منحنی نمای نیم رخ افقی را با مشتق تابع گاسین فیلتر نماییم.*********** شكل 1: استخراج خطوط متن الف) تصویر متن ب) منحنی نیم رخ افقی ج) منحنی نیم رخ افقی پس از هموارسازی (ب) هر یك از خطوط متن كه در مرحله قبل پیدا شدند، باینری شده و سپس نمای نیم رخ عمودی مربوط به آن محاسبه می شود. با كمك این منحنی فاصله های بین كلمات را پیدا می كنیم و فاصله هایی كه اندازه آنها از 5 نقطه بیشتر باشد را با مقدار 5 نقطه نرمال می كنیم. بنابراین فاصله كلمات حداكثر 5 نقطه خواهد بود و فاصله های كمتر از 5 نقطه نیز بعنوان فاصله های بین حروف در نظر گرفته می شوند. همچنین در صورتی كه انتهای خط خالی باشد، با تكرار مجد فاصله بین خطوط و پر كردن خطوط در شكل 2-الف ارایه شده است.(ج) در صورت خالی بودن بخش انتهایی تصویر، آنرا با تكرار مجدد خطوط ابتدایی تصویر به نحوی پر می كنیم كه طول تصویر به اندازه مشخصی (در این مقاله 384 نقطه) برسد. در شكل 2-ب تصویر نرمال سازی شده نهایی ارایه شده است.******************* شكل 2: الف) نرمال سازی بین كلمات، فاصله خطوط و پركردن انتهای خطوط ب) پركردن بخش انتهایی (تصویر نهایی)2-2- استخراج ویژگیبه منظور ارایه روشی كارا جهت تعیین هویت نویسنده، باید ویژگی هایی را در نظر گرفت كه بیانگر تفاوت دستخط های مختلف می باشند. بنابراین در این مقوله استفاده از ویژگی های معرفی شده در مطالعات OCR مناسب به نظر نمی رسد زیرا هدف طراحی این ویژگی ها، تشخیص كلمات و حروف مستقل از تفاوت دستخطهای مختلف می باشد. به دلیل كارایی خوب فیلتر گابور در بحث تحلیل بافت و كاربردهای مشابه [12و11و8]، محاسبه ویژگیها را بر این اساس انجام دادیم. برای این منظور طراحی بانك فیلتر گابور را بر اساس نتایج تجربی و مطالعات انجام شده در زمینه نحوه عملكرد سیستم بینایی انجام داده ایم وبرای استخراج ویژگی، یك روش جدید بر اساس گشتاورهای هندسی و انرژی گابور پیشنهاد كرده ایم. همچنین با استفاده از بانك فیلتر طراحی شده، سایر روشهای موجود برای استخراج ویژگی مبتنی بر فیلترهای گابور را بررسی و مقایسه نموده ایم. علاوه بر این ویژگی های مبتنی بر ماتریس هم وقوعی و روش ارائه شده توسط Said را به عنوان دو روش مقایسه ای دیگر مورد بررس قرار داده ایم.2-2-1- استخراج ویژگی روش پیشنهادیتحقیقات علم فیزیولوژی نشان می دهد كه پردازش اطلاعات تصویری در سیستم بینایی، توسط مجموعه ای از مكانیسم های موازی به نام كانالها انجام می شود به طوریكه هر كانال برای یك باند فركانسی كم پهنا و با جهت مشخص تنظیم می گردد. به لحاظ ریاضی هر یك از این كانالها با یك جفت فیلتر میان گذر گابور مدل سازی می شوند. ما در روش پیشنهادی از فیلترهای گابور چند كانالی كه در [13] معرفی شده اند، استفاده كرده ایم. ویژگی این فیلترها در نظرگرفتن یافته های تجربی در طراحی آنهاست و با رابطه زیر تعریف می شوند:(1) در این رابطه زوج مركز فیلتر را مشخص می كند و پارامتر نیز انحراف معیار تابع گاسین است كه اندازه محدوده پذیرش فیلتر را تعیین می كند. مقدار شكل كشیدگی توابع یا محدوده پذیرش را مشخص می كند و مثلاً برای مقدار 1= شكل توابع گابور در حوزه فركانس بصورت دایره و برای مقادیر 1< به صورت بیضی خواهد بود. پارامتر طول موج تابع cos و مشخص كننده فركانس مكانی /1 مربوط به كانال مورد نظر می باشد. پارامتر كه مقداری بین 0 و را انتخاب می كند، جهت مربوط به كانال را تعیین می نماید. در واقع دو پارامتر و مشخص كننده مكان كانال مورد نظر در نقشه فركانسی و پارامتر نیز تعیین كننده فاز است. پاسخ فیلتر گابور از كانولوشن تابع معرفی شده در رابطه (1) با تصویر بلوك مورد نظر به دست خواهد آمد:(2) در این رابطه پاسخ فیلتر گابور و f(x,y) نیز تصویر بلوك مورد نظر می باشد. بر همین اساس مقدار انرژی گابور كه از تركیب پاسخ یك جفت سلول ساده با اختلاف فاز 2/ بدست می آید، با رابطه زیر تعریف می شود:(3) انرژی گابور رفتار سلولهای پیچیده سیستم بینایی را مدل سازی می كند و به عنوان ویژگی مؤثر در بسیاری از روشهای تحلیل بافت مورد استفاده قرار می گیرد [13و8]. بر اساس نتایج تجربی، پهنای باند فركانسی برای سلولهای ساده ی قشر بینایی در حدود 1 اكتاو است [14]، بنابراین ن سبت كه تعیین كننده پهنای باند فركانسی است با مقدار ثابت 0/56 مقداردهی می شود به نحوی كه براساس رابطه زیر پهنای باند كانال برابر 1 اكتاو شود:(4) بر اساس مطالعاتی كه Wiesel , Hubel [15] انجام داده اند، سلولهای ساده در راستای جهت های خاصی با پهنای باند تقریبی ْ30 حساس هستند. بنابراین در روش پیشنهادی برای هشت جهت و همچنین سه فركانس مكانی مقدار انرژی گابور را محاسبه نموده و 24 تصویر پاسخ بدست می آید. انتخاب فركانسها و جهت ها باید به نحوی باشد كه دامنه فركانسی پوشش داده شود (شكل 3). *********** شكل 3: دامنه فركانس پوشش داده شده با 24 فیلتر انتخابیدر هر كانال، پاسخ های فیلترهای گابور ارایه كننده نواحی است كه در راستای جهت و فركانس كانال می باشند. یك معیار مهم برای تفكیك نمودن بافت های مختلف این است كه ویژگیهای مربوط به شكل هر یك از این نواحی را استخراج نماییم. در این مقاله استخراج ویژگی از خروجی فیلترهای گابور را با استفاده از گشتاورهای هندسی انجام داده ایم. گشتاور مرتبه (p+q) برای ناحیه ی R از تصویر فیلتر شده ی E1 با رابطه زیر محاسبه می شود:(5) از پنج ماسك ارایه شده در شكل 4 برای محاسبه گشتاورها و استخراج ویژگی استفاده نموده ایم. این ماسك ها به هر 24 تصویر فیلتر شده اعمال می شوند و به ازای هر تصویر فیلتر شده E1، پنج تصویر گشتاور Mik (k=1,2,3,4,5) بدست خواهد آمد. شكل 4: ماسكهای استفاده شده جهت محاسبه تصاویر گشتاورهابرای اینكه تصاویر گشتاوری كه دارای آمارگان مرتبه دو یا شدت روشنایی یكسان می باشند، از یكدیگر متمایز شوند، یك تبدیل غیرخطی به تصاویرگشتاورها اعمال شده و سپس بردار ویژگی نهایی بر اساس قدرمطلق انحراف از میانگین تصویر حاصل به دست می آید:(6) Fik به عنوان kامین ویژگی است كه از تصویر فیلتر شده E1 با اندازه n*m محاسبه می شود. نیز مقدار میانگین مربوط به تصویر گشتاور Mik است. تابع تانژانت هایپربولیك كه برای تبدیل غیرخطی مورد استفاده قرار گرفته، شكلی لگاریتمی دارد و در مطالعات Farrokhnia , Jain نیز بعنوان آشكارساز حباب ها مورد استفاده قرار گرفته است [16]. پارامتر شكل لگاریتمی تابع tanh را كنترل می كند و بر اساس نتایج تجربی مقدار 0/25 را اختیار می كند.2-2-2- انرژی گابور انرژی گابور بعنوان یك ویژگی مفید در روشهای مبتنی بر فیلترهای گابور مورد استفاده قرار می گیرد. همچنین فیلترهای گابور چند كانالی و ویژگی انرژی گابور در [11]، برای تعیین نوع زبانِ متون چاپی به كار رفته اند. Zhu از انرژی گابور برای شناسایی نوع قلم در زبان انگلیسی و چینی استفاده كرد [12]. در این مقاله مقدار انرژی گابور را برای بانك فیلتر طراحی شده محاسبه نموده و چون شكل هیستوگرام تصاویر پاسخ اغلب شبیه به یك تابع گاسین است [11]، بنابراین میانگین و انحراف معیار هر 24 تصویر انرژی گابور محاسبه شده و بردار ویژگی نهایی را تشكیل می دهند. برای هر تصویر بلوك ورودی یك بردار ویژگی 48 تایی بدست خواهد آمد. 2-2-3- تبدیل فوریه انرژی گابورTan [17] مجموعه ای از ویژگی هایی را پیشنهاد نمود كه بر اساس تبدیل فوریه انرژی گابور محاسبه شه و نسبت به چرخش نیز حساس نمی باشند. با كمك این ویژگیها، نوع زبان در متون چاپی تشخیص داده می شود. در این روش ابتدا انرژی گابور محاسبه شده و سپس مقدار متوسط برای تصویر انرژی گابور با رابطه زیر محاسبه می گردد:(7) تصویر انرژی گابور و مساحت تصویر انرژی گابور است. برای یك فركانس ثابت ، تبدیل فوریه یا بسادگی محاسبه شده و ضرایب فوریه به عنوان ویژگی بكار می روند. اگر تعداد جهت ها در یك فركانس مشخص برابر M باشد، آنگاه حداكثر تعداد ویژگیهای مستقل با توجه به گسسته بودن تابع ، برابر M/2+1 خواهد بود. این ویژگیها برای بانك فیلتر پیشنهادی محاسبه شده و برای هر تصویر بلوك ورودی 15)5*3) ویژگی بدست خواهد آمد. ادامه خواندن مقاله در مورد مقايسه ويژگي هاي مبتني بر فيلترهاي گابور و ارايه روشي جديد براي تعيين هويت نويسنده بر اساس دست نوشته فارسي

نوشته مقاله در مورد مقايسه ويژگي هاي مبتني بر فيلترهاي گابور و ارايه روشي جديد براي تعيين هويت نويسنده بر اساس دست نوشته فارسي اولین بار در دانلود رایگان پدیدار شد.


Viewing all articles
Browse latest Browse all 46175

Trending Articles



<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>