عملکرد الگوریتم های رگرسیون در بازشناسی احساس از طریق گفتار در فضای پیوسته احساس
Paper ID : 1080-ICTCK (R2)
Authors:
زری فاتح *
دانشجو/ دانشگاه آزاد اسلامی تهران واحد الکترونیکی کارشناس انفورماتیک/ موسسه آموزش عالی اشراق
Abstract:
بازشناسی احساس از طریق گفتار، موضوعی میان رشته‌ای در حوزه‌ی روانشناسی، بازشناسی الگو و پردازش سیگنال می‌باشد که در دهه‌ی اخیر، توجه بسیاری از پژوهشگران را به خود جلب نموده است. در این تحقیق، پنج گروه از ویژگی های مهم صوتی شامل ویژگی های عروضی، MFCC، PLP، LPC و فرمنت ها جهت استخراج ویژگی، الگوریتم‌ های کاهش ویژگی SFS و SBS ، جهت انتخاب بردار ویژگی بهینه و الگوریتم های رگرسیون خطی، بردار پشتیبان و فرایند گوسی به منظور تخمین مؤلفه های احساسی گفتار شامل برانگیختگی، تسلط و جاذبه، در فضای پیوسته سه بعدی با استفاده از پایگاه داده ی VAM، بکار گرفته شده است. بر اساس نتایج آزمایش‌ها، از بین پنج گروه ویژگی استفاده شده، بهترین نتایج با استفاده از ویژگی های عروضی حاصل شده است. اما برای ترکیب ویژگی های مختلف، نتیجه کاملاً بستگی به الگوریتم های رگرسیون و کاهش ویژگی دارد. بطوریکه بهترین نتایج مربوط به ترکیب همه ی ویژگی ها و با استفاده از الگوریتم رگرسیون فرایند گوسی و کاهشی ویژگی SFS می باشد. در این شرایط، ضریب همبستگی برای سه مؤلفه احساسی جاذبه، برانگیختگی و تسلط بترتیب برابر 43%، 74% و 74% می باشد.
Keywords:
بازشناسی احساس از طریق گفتار، فضای پیوسته احساس، ویژگی های عروضی و طیفی ، رگرسیون خطی، رگرسیون بردار پشتیبان، رگرسیون فرایند گوسی.
Status : Paper Accepted