بهبود روش MFCC برای تشخیص گوینده در عملیات جاسوسی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 استادیار و عضو هیئت علمی دانشگاه جامع امام حسین(ع)

2 دانش‌آموخته کارشناسی ارشد دانشکده برق دانشگاه علم و صنعت ایران

چکیده

در این مقاله، روشی جدید برای استخراج ویژگی از سیگنال صوت و تشخیص گوینده صدا ارائه شده است که کاربرد وسیعی در علوم جاسوسی و پدافند غیرعامل دارد (بدین صورت که با تشخیص گوینده یک صدای ضبط‌شده می­توان اولا مانع تقلید صدای افراد خاص مانند فرماندهان شد و ثانیاً می­توان در استراق سمع مکانی که چندین نفر در حال گفتگوی مهمی هستند، گوینده هر صدا را تشخیص داد). در واقع روش ارائه‌شده، بهبودیافته روش MFCC می­باشد. از آن­جایی که با توجه به آزمایشات، بیشتر اطلاعات صوت در فرکانس‌های پایین آن ذخیره می­شود و فرکانس­های بالای آن اطلاعات تفکیک‌کننده زیادی ندارد، محققان معمولاً ویژگی­های صوت را از فرکانس­های پایین سیگنال صوت استخراج می­کنند. در روش ارائه‌شده در این مقاله، فیلتر فرکانسی Mel که در روش MFCC استفاده می­شود، تغییر و بهبود داده شده و در انتها نتایج روش ارائه‌شده (MMFCC) با روش MFCC مقایسه شده و بهبود آن اثبات شده است. نتایج حاصله برای 20 گوینده متفاوت مؤید این است که برای روش بهبودیافته خطی درصد تشخیص گوینده حدود 5/4٪ و برای روش بهبودیافته نهائی حدود 9٪ ارتقاء یافته است.

کلیدواژه‌ها


عنوان مقاله [English]

Improving MFCC Method for Speaker Recognition in Spying Operations

نویسندگان [English]

  • A. Chaman Motlagh 1
  • A. Najafipoor 2
1 ihu
2 -
چکیده [English]

In this article, a new method is introduced for extracting features from vocal signals and discriminating speakers, which has a vast application in spy operations and passive defense sciences (for example; not only by using this method, it is possible to prevent the imitation of particular people’s voice such as commanders but also the detection of every speakers’ voice when eavesdropping the place where a number of people are discussing an important matter can be made possible). The introduced method is the improved version of MFCC method. Experimental studies say that the most useful information of vocal signals is in their low frequencies and their high frequencies are not useful in speaker recognition procedures. The method introduced in this article, the Mel frequency filter which is used in MFCC, is changed and improved. The results of MFCC and the proposed method are compared for 20 speakers and the speaker recognition percentage has improved approximately 4.5% for the linear and 9% for the exponential proposed methods.

کلیدواژه‌ها [English]

  • Spying
  • Passive Defense
  • Speaker Recognition
  • Mel Filter
  • MFCC Method
  • Feature Extraction