2010年12月8日 星期三

mmai 2010 proposal

member:  楊皓中

project name: 談話性節目 - 人物說話片段切割與整合

scenario
    小明是張有滑的粉絲,只要有有滑出現的節目,小明都會看,但除了有滑之外,其他人的節目片段小明都沒興趣,小明只想快速瀏覽有滑出現的節目片段。

introduction
    將談話性節目中,每個人的說話片段切出來,再利用人臉偵測以及人臉比對的技術,將每個片段依照發言者做分類,並在時間軸上標記每個時間點的發言者,也可以對同一個發言者的說話片段建立index,如此使用者就可以快速的瀏覽感興趣的人物的發言。

method
    切割不同人物的說話片段,以及在不同片段中判斷是否是同一個發言者,除了可以靠影像的技術像 eigenface,也可以利用語音的資訊,因為不同發言者的聲音有所差距,每當換了發言者,語音的特徵也跟著改變了。

沒有留言:

張貼留言