فهرست مطالب
چکیده.................................................................................................................................................................................. 1
مقدمه.................................................................................................................................................................................... 2
فصل اول: اصول کلی در ایجاد حالت در گفتار و روشهای مختلف شناسایی حالت گفتار............................. 5
-1 ایجاد و بازشناسی حالت در گفتار................................................................................................................. 5 -1
-1-1 روابط صوتی حالت در گفتار انسانی....................................................................................................... 5 -1
-2-1 ارزیابی با نمونههای انسانی........................................................................................................................ 7 -1
-3-1 بازشناسی حالت در گفتار انسانی............................................................................................................ 7 -1
و درخت تصمیم گیری در سیستم ها ی K-NN، SVM ، -2-1 مقایسه الگوریتمهای شبکه عصبی
پاسخگوی صوتی متقابل............................................................................................................................................... 8
-1-2 بازشناسی حالت............................................................................................................................................. 9 -1
-2-2 بانک اطلاعاتی................................................................................................................................................ 9 -1
-3-2 استخراج ویژگیها....................................................................................................................................... 10 -1
-1-3-2 ویژگیهای فرکانس گام....................................................................................................................... 10 -1
-2-3-2 ویژگیهای انرژی.................................................................................................................................. 10 -1
-3-3-2 ویژگیهای طول زمان شنیداری......................................................................................................... 11 -1
-4-2 گروهبندی و نتایج........................................................................................................................................ 11 -1
ها برای بازشناسی حالت در گفتار روزمره .............................................................. 14 GMM -3 استفاده از -1
-1-3 نتایج................................................................................................................................................................ 16 -1
و شبکههای عصبی..................................... 17 K-NN -4 شناسایی و تشخیص حالت گفتار با استفاده از -1
-1-4 مراحل تحقیق............................................................................................................................................... 18 -1
-2-4 استخراج ویژگیها........................................................................................................................................ 19 -1
و مقایسه آنها با یکدیگر................. 20 HMM ، SVM ، QDA -5 بازشناسی حالت با استفاده از آنالیز -1
-1-5 فرآیند بازشناسی حالت............................................................................................................................ 20 -1
-2-5 انتخاب و رتبهبندی ویژگیها................................................................................................................... 20 -1
-3-5 نتیجه ............................................................................................................................................................... 22 -1
-6 بازشناسی حالت گفتار با استفاده از رای اکثریت کارشناسان زیرفضا................................................ 22 -1
ز
-1-6 استخراج ویژگیها....................................................................................................................................... 23 -1
-7 بازشناسی حالات گفتار چندزبانه با استفاده از آنالیز مؤلفههای اصلی............................................... 24 -1
-1-7 بازشناسی حالات......................................................................................................................................... 24 -1
-2-7 تفکیکپذیری حالات احساسی............................................................................................................... 25 -1
-3-7 بازشناسی حالت گفتار چند زبانه............................................................................................................ 26 -1
26............... SVM -8 بازشناسی حالت در سیگنالهای بالقوه زیستی با استفاده از شبکههای عصبی و -1
-1-8 جمعآوری دادههای حالتدار ..................................................................................................................... 27 -1
-2-8 دستهکننده الگو............................................................................................................................................. 27 -1
-3-8 بازشناسی حالت........................................................................................................................................... 28 -1
-9 بازشناسی حالت گفتار با استفاده از مدل مارکوف مخفی...................................................................... 28 -1
-1-9 استخراج پوش ویژگیهای خام .............................................................................................................. 29 -1
ها.................................................................................................. 29 GMM -2-9 ویژگی عمومی با استفاده از -1
-3-9 مجموعه گفتار.............................................................................................................................................. 30 -1
-4-9 نتایج................................................................................................................................................................ 30 -1
-10 بازشناسی حالت گفتار با استفاده از شبکه عصبی................................................................................. 30 -1
-1 طراحی سیستم........................................................................................................................................... 31 -10 -1
-1-1 حالت گفتار........................................................................................................................................... 31 -10 -1
-2-1 مفهوم مستقل از گوینده..................................................................................................................... 31 -10 -1
-3-1 مراحل پردازش.................................................................................................................................... 32 -10 -1
-4-1 ساختار شبکه عصبی............................................................................................................................ 33 -10 -1
-2 آزمایش بازشناسی حالت........................................................................................................................ 34 -10 -1
-1-2 پایگاه داده گفتار .................................................................................................................................. 34 -10 -1
-2-2 روشهای آموزش و آزمایش........................................................................................................... 35 -10 -1
-3-2 نتایج........................................................................................................................................................ 35 -10 -1
37...............LPC -11 مقایسه مدل فازی و شبکه عصبی در بازشناسی حالت گفتار با استفاده از آنالیز -1
-1 بازشناسی کننده حالات........................................................................................................................... 38 -11 -1
-2 آزمایش........................................................................................................................................................ 39 -11 -1
ح
-3 نتایج ............................................................................................................................................................. 40 -11 -1
-12 بازشناسی حالت گفتار با استفاده از تغییرات حالت چهره.................................................................. 41 -1
42............................................................................................................ Fuzzy ARTMAP فصل دوم: شبکه عصبی
-1 استفاده از شبکه عصبی.................................................................................................................................... 42 -2
43......................................................................................................................................ARTMAP -2 شرح شبکة -2
44.......................................................................................................................................... Fuzzy ARTMAP -1-2 -2
فصل سوم: بازشناسی چهار حالت گفتاری با استفاده از شبکه عصبی................................................................... 48
-1 مقدمات انجام پروژه.......................................................................................................................................... 48 -3
-1-1 گردآوری اطلاعات و دادههای مورد نیاز برای انجام پروژه............................................................ 48 -3
-2-1 شرایط و جملات ضبط شده.................................................................................................................. 49 -3
-3-1 پردازش دادههای خام............................................................................................................................... 59 -3
-2 مشخصات شبکه عصبی مورد استفاده......................................................................................................... 60 -3
-3 انتخاب حالتهای قابل بازشناسی............................................................................................................... 61 -3
-4 انتخاب ویژگیها برای بازشناسی................................................................................................................. 62 -3
-5 مشکلات بازشناسی حالت............................................................................................................................. 65 -3
-6 نتایج آزمایش حالتهای مختلف................................................................................................................. 67 -3
-1-6 آزمودن شبکه عصبی طراحی شده.......................................................................................................... 68 -3
-2-6 بازشناسی چهار حالت با 20 گوینده برای آموزش............................................................................ 69 -3
-3-6 بازشناسی سه حالت با 20 گوینده برای آموزش................................................................................ 79 -3
-4-6 تاثیر تعداد دادههای آموزشی و آزمایشی.............................................................................................. 85 -3
-1-4-6 بازشناسی چهار حالت با 19 گوینده برای آموزش..................................................................... 85 -3
-2-4-6 بازشناسی چهار حالت با 18 گوینده برای آموزش..................................................................... 88 -3
-5-6 بازشناسی چهار حالت با 52 ویژگی...................................................................................................... 89 -3
-7 تاثیر پارامترهای مختلف روی حالتهای مختلف................................................................................... 96 -3
فصل چهارم : جمعبندی................................................................................................................................................ 97
منابع..
پایان نامه ارشد برق شناسایی چند حالت گفتاری در زبان فارسی با استفاده از ویژگی های نوای گفتار به کمک شبکه های عصبی