MP3音樂快譯通
簡介
-
設計一套以MP3為主的內涵式音樂庫檢索系統
- 使用者可利用音樂搜尋而非傳統文字搜尋系統
- 不知歌名、歌手、作者等資訊
- 只有一段片段音樂(利用手機、PDA或其他錄音設備)
- 以內涵式(Content-Based)搜尋的方式、利用物件本身的內涵資料(頻譜能量、旋律、音高)當成索引資訊對資料庫做搜尋及擷取(query
by example)。
- 一般分為未壓縮及壓縮兩個方式
- 未壓縮:運算較簡單但檔案大;如Wave, PCM等。
- 壓縮 :檔案小但相對的技術較複雜;如MP3, AAC等。
軟硬體平台簡述
系統架構
特徵值擷取模組
- 取頻譜值作為特徵值
- 減少大量計算及時間但仍維持不錯的準確度
MP3
decoder複雜度分析:
索引結構模組(Feature Indexing)
- Quantization-Tree Indexing
- 將任意長度的輸入歌曲片段轉為一段段固定長度的N維向量(Slot)
- 再以這些Slot為搜尋的單位對資料庫進行比對
索引結構模組(Feature Indexing)
- 利用音樂的旋律線輪廓的概念來進行歌曲與歌曲間相似度比對
- 取N個Frame為一個音長,算出此音長的能量,並記錄每個音之間的關係
- 用來提升整體比對的準確率
相似度比對模組(Similarity Measurement)
- 將第一階段比對結果再以Melody-Line Tracking進行第二階段比對
- 最後將兩階段比對結果依大小順序排列並將結果依相對應的歌曲名稱由小到大列出
硬體設計
- 輸出介面及控制單元
- DAC輸出播放模組(AD1856)
系統設計流程
實作成果
完成項目
- 音樂索引及擷取系統
- 演算法開發(特徵值選取、索引結構、相似度比對)
- MP3音樂資料庫建立
- 簡單的使用者介面
- 支援Query by example and Query
by recorded song
- 即時撥放之MP3 Decorder
- File Format: MP3
- Channel: 2
- Sampling Frequency: 44.1khz
- Bit rate: 64~196kbps
- M/S, Intensity Stereo: support
- ARM946E-S Clock: 90Mhz
- 音訊輸出介面
- DAC module(I2S
format)
- Out buffer及控制單元