【這很AI】又一全新交互技術(shù)?

更新時(shí)間:0000-00-00 00:00:00    閱讀:2086

先想象這樣一個(gè)場景:當(dāng)你看到一個(gè)畫面時(shí),通過一個(gè)小應(yīng)用,能隨時(shí)配上一首契合圖像意境的音樂,是不是看起來更酷?

先想象這樣一個(gè)場景:當(dāng)你看到一個(gè)畫面時(shí),通過一個(gè)小應(yīng)用,能隨時(shí)配上一首契合圖像意境的音樂,是不是看起來更酷?

微信圖片_20181113181046.jpg


有這樣一種假象:當(dāng)音樂響起,結(jié)合畫面圖景,會讓你產(chǎn)生一種遠(yuǎn)離辦公室或臥室,坐在森林旁邊的潺潺流水中,甚至分身到暴露的山坡上的情景感。


日本研究人員的一個(gè)新項(xiàng)目就利用了這種想象力的潛力,并將其與AI算法結(jié)合,實(shí)現(xiàn)了這種奇妙的效果。


具體說來,是通過一款叫“Imaginary Soundscape” 的網(wǎng)絡(luò)應(yīng)用程序,使用機(jī)器學(xué)習(xí)來將您上傳的任何圖片和最符合的音頻配對。

微信圖片_20181113181051.jpg




上圖為這款產(chǎn)品的首頁,簡單明了,你要做的就是上傳一張圖片,然后進(jìn)入另外一個(gè)頁面,顯示你上傳的圖片同時(shí),同時(shí)就會放出經(jīng)過AI算法匹配后的背景音樂。


例如,上傳日本的漁船木刻,這個(gè)系統(tǒng)會匹配波浪和水聲;加載一幅抽象的夜鶯畫作,人工智能會給你搭配一首風(fēng)鈴和鳥叫的音景音樂。


微信圖片_20181113181056.jpg


再比如上傳上面這個(gè)畫面,系統(tǒng)匹配的音樂就是一首相當(dāng)古典的交響樂。

通常來說,結(jié)果正如你所期望的那樣,畫面什么樣,匹配的音樂也近乎切合。但更有意思的是,當(dāng)系統(tǒng)接收到你上傳一些稀奇古怪的元素時(shí),系統(tǒng)反饋的配音也會帶來驚喜,比如將擎天柱與拖拉機(jī)聲音配對。

微信圖片_20181113181100.jpg


所有這些都是一個(gè)相對簡單的AI算法的產(chǎn)物。它使用物體識別來識別圖像中的元素,然后將這些元素與超過52,000個(gè)聲音文件的數(shù)據(jù)集進(jìn)行匹配。


這個(gè)產(chǎn)品的研究人員,東京大學(xué)的Yuma Kajihara,Shoya Dozono和Nao Tokui多年來一直在研究這種“交叉模式”模型。 


Imaginary Soundscapes的早期版本于1月份推出,旨在將音頻與Google街景視圖中的圖像進(jìn)行匹配。


這是一個(gè)有趣的小應(yīng)用程序,也是AI支持的新型創(chuàng)意表達(dá)的絕佳示例。該系統(tǒng)并不完美,比如模糊識別會造成錯(cuò)誤,而聲音數(shù)據(jù)庫無可避免地不完整,但這也是其魅力和神奇所在,你永遠(yuǎn)不知道它會給你匹配什么美妙的音樂。


如果有的話,它產(chǎn)生的偶然和意想不到的音樂背景比“正確”的匹配更有趣。



________________


“閃電配音”是內(nèi)容與媒體首選的配音服務(wù)商,平臺可實(shí)現(xiàn)7*24小時(shí)在線、最快15分鐘實(shí)現(xiàn)千字配音且達(dá)到FM音質(zhì)標(biāo)準(zhǔn)的實(shí)際要求,每百字僅需2-10元,通過產(chǎn)品驅(qū)動(dòng)滿足了對時(shí)效性要求高的自媒體等行業(yè),實(shí)現(xiàn)了配音行業(yè)生產(chǎn)方式的變革?,F(xiàn)階段,平臺已簽約主播1萬多名,平均每天有2千~3千筆訂單,已服務(wù)累計(jì)服務(wù)客戶超過3000家。行業(yè)覆蓋新聞媒體、自媒體、知識付費(fèi)、短視頻、出版社有聲書業(yè)務(wù)等;包括故宮、知識分子、見字如面、吳曉波頻道、極客公園;磨鐵、郵電出版社、喜馬拉雅等。

閃電配音

掃碼免費(fèi)試音
企業(yè)微信

免費(fèi)試音

幫我推薦

價(jià)格計(jì)算

在線下單

開具發(fā)票

不招主播

確認(rèn)提交

全網(wǎng)全品類皆可配 頂配好聲音

點(diǎn)我咨詢
錯(cuò)誤