Bảng thống kê danh sách bài báo đăng trên kỷ yếu Quốc tế năm 2007

stt Tên bài mã số, thời gian thực hiện Tác giả Tóm tắt nội dung Tạp chí đăng tải
Kỷ yếu cấp Quốc tế
1 Một hệ thống phân biệt người nói không phụ thuộc từ khóa bền vững dựa trên biến đổi wavelet, 2007 Phùng Trung Nghĩa, Phạm Việt Bình, Nguyễn Hữu Thái, Nguyễn Thanh Hà, Prayoth Kumsawat
Nghiên cứu này đề xuất một hệ thống  phân biệt người nói không phụ thuộc từ khóa bền vững dựa trên biến đổi wavelet rời rạc, các hệ số wavelet rời rạc trên thang tần số Mel, kỹ thuật đặt trọng số băng con wavelet và mô hình kết hợp Gaussian giống nhất.
Phương pháp đề xuất được so sánh với hệ thống nhận dạng được sử dụng phổ biến dùng đặc trưng MFCC, hệ thống nhận dạng toàn băng, và hệ thống nhận dạng băng con với trọng số đều.
Kết quả thực nghiệm cho thấy phương pháp đề xuất đã đạt được tỉ lệ nhận dạng cao hơn các phương pháp khác với cơ sở dữ liệu tiếng nói tiếng Việt sạch và có nhiễu trắng.
Kỷ yếu hội thảo khoa học quốc tế IEEE về tính toán thông minh và các ứng dụng đa phương tiện, Sivikasi, Ấn độ, tháng 12/2007, trang 219-223.
A robust wavelet-based text-independent speaker identification, 2007  Phung Trung Nghia, Pham Viet Binh, Nguyen Huu Thai, Nguyen Thanh Ha, Prayoth Kumsawat. This study proposed a robust text-independent speaker identification based on the Discrete Wavelet Transform (DWT), the Mel-Frequency Discrete Wavelet Coefficients (MFDWC), the wavelet-based sub-band weighting and the Likelihood Combination Gaussian Mixture Model (LCGMM).  
This method was used in the text-independent speaker identification in compare to the widely used MFCC features recognizer, full-band recognizer and equal sub-band weighting recognizer.
Our experimental results show that our proposal achieved higher recognition rate than the others for our Vietnamese speech corpus with clean and white noisy speech.
Proceeding of the IEEE International Conference on Computational Intelligence and Multimedia Applications (ICCIMA 2007), Sivikasi, India, pp. 219 – 223, 12/2007.
2 Một bộ mã hóa tiếng nói băng rộng tốc độ bit thấp trên miền wavelet cảm thụ, 2007. Phùng Trung Nghĩa, Vũ Ngọc Phàn Tiếng nói là thông tin phổ biến nhất trong các hệ thống truyền thông. Có rất nhiều phương pháp và chuẩn mã hóa tiếng nói, hầu hết dùng cho tiếng nói băng hẹp. Trong các hệ thống viễn thông hiện đại, mã hóa tiếng nói băng rộng là rất quan trọng. Kỷ yếu hội nghị khoa học quốc tế về kỹ thuật Điện – Điện tử, TP Hồ Chí Minh, Việt Nam, tập 2, trang 139-144, tháng 10/2007
A low bit rate wide-band speech coder in the perceptual wavelet packet domain, 2007 Phung Trung Nghia, Vu Ngoc Phan Speech  is  the most  popular  information  in  telecommunications. There  are  several methods  and standards  for  speech  coding.  Most  of  them  are  used  for  narrowband  speech.  In  modern telecommunication systems, wideband speech coding is very important.
Wavelet  is  an  efficient  signal  processing  tool  for  speech  coding.  Conventional wavelet  speech coders use wavelet global or sub-band dependent threshold to allocate bits in each sub-band. It is not very efficient for wideband speech because these thresholds are not close to human auditory hearing.  Using psychoacoustic model with  temporal and  simultaneous properties, we will be able  to estimate the threshold close to human hearing.
Most of  speech  and  audio  coding algorithms  rely  solely on  simultaneous masking models. This paper presented a wavelet packet based wideband speech coding incorporating both backward temporal, forward temporal and simultaneous masking models. The coder used also other lossless compressions. By  applying  this  model  we  were  calculated  the  bit  rate  results  of  approximately  25  kbps  while preserving perceptual quality with single channel wide-band speech sampled at 16 KHz.
Proceeding of the International Symposium on Electrical and Electronics (ISEE 2007), Ho Chi Minh city, Vietnam, Track 2, pp 139 – 144, 10/2007.