寫稿機(jī)器人“小南”上崗
2017-01-19 來源:南方都市報(bào) 評(píng)論:0摘要: 1月17日,南方都市報(bào)社寫稿機(jī)器人小南正式上崗,并推出第一篇共300余字的春運(yùn)報(bào)道。此外,南方都市報(bào)社、凱迪網(wǎng)絡(luò)和北京大學(xué)計(jì)算機(jī)科
1月17日,南方都市報(bào)社寫稿機(jī)器人“小南”正式上崗,并推出第一篇共300余字的春運(yùn)報(bào)道。此外,南方都市報(bào)社、凱迪網(wǎng)絡(luò)和北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所還在小南的基礎(chǔ)上,聯(lián)合成立了“智媒體實(shí)驗(yàn)室”,探索人工智能在媒體上的更多應(yīng)用。
首篇文章一秒完成
請(qǐng)用5秒的時(shí)間思考以下新聞的共同點(diǎn):《蘋果第一季度營收超華爾街預(yù)測》(A pple topsStreet1Qforecasts),2015年1月發(fā)布;《8月CPI漲2%創(chuàng)12個(gè)月新高》,2015年9月發(fā)布;《綿陽安州發(fā)生4 .3級(jí)地震》,2016年5月發(fā)布;《奧運(yùn)會(huì)乒乓球女子單打四分之一決賽 丁寧(中國)4:0輕松晉級(jí)下一輪》,2016年8月發(fā)布。
這道題其實(shí)沒有標(biāo)準(zhǔn)答案,但不管你有沒有注意到,有一點(diǎn)非常重要:這些新聞的作者,都不是人?;蛟S你已經(jīng)聽說過“寫稿機(jī)器人”———在寫作這一似乎最不可能被機(jī)器人涉足的領(lǐng)域,變化正在發(fā)生。
看看這些數(shù)字:蘋果財(cái)報(bào)發(fā)布數(shù)分鐘后,美聯(lián)社的機(jī)器人報(bào)道便已完成,他們還號(hào)稱每個(gè)季度可撰寫3000篇財(cái)經(jīng)報(bào)道?!都~約時(shí)報(bào)》走得更快,其機(jī)器人編輯Blossom blot每天推送300篇文章,在財(cái)報(bào)季、運(yùn)動(dòng)比賽報(bào)道中寫稿已成慣例。
如此速度和質(zhì)量,確實(shí)讓人類記者望塵莫及。但真正嘗試使用機(jī)器人寫稿的媒體,尤其是在國內(nèi),還并不多。如今,小南正式入場。
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所萬小軍教授,是小南的技術(shù)開發(fā)團(tuán)隊(duì)負(fù)責(zé)人。他透露,小南的首篇春運(yùn)報(bào)道作品,共300余字,數(shù)據(jù)自動(dòng)抓取完成后,報(bào)道的生成只用了不到一秒的時(shí)間。
率先進(jìn)軍民生領(lǐng)域
與其他機(jī)器人“同行”有所區(qū)別的是,小南聚焦的是民生領(lǐng)域報(bào)道。
此前,寫稿機(jī)器人大顯身手的領(lǐng)域,往往是體育和財(cái)經(jīng)———因?yàn)檫@兩個(gè)領(lǐng)域都涉及大量數(shù)據(jù)。從龐雜、枯燥的數(shù)據(jù)中尋找模式,就準(zhǔn)確度和速度而言,機(jī)器人比人類更有優(yōu)勢(shì)。
人類的筆法千變?nèi)f化,但總是有“套路”,也就是模式和規(guī)則可以依循的。這時(shí)候,算法就有了用武之地。
采集數(shù)據(jù)、分析數(shù)據(jù)、規(guī)劃文章結(jié)構(gòu),再到最終的遣詞用句,和人類一樣,機(jī)器人也能做到“讀書破萬卷,下筆如有神”。海量的數(shù)據(jù)和高效的算法,是寫稿機(jī)器人的兩大利器。
相較于體育和財(cái)經(jīng)領(lǐng)域,民生報(bào)道的生成對(duì)機(jī)器人來說略為棘手。許多財(cái)報(bào)文章都大同小異,但民生報(bào)道的“套路”可就太多了,從交通出行到食品安全,主題也五花八門。
一個(gè)民生領(lǐng)域的人類記者可以同時(shí)報(bào)道交通和食品領(lǐng)域,但就目前而言,讓機(jī)器人做到跨界的“融會(huì)貫通”還需要時(shí)間。萬小軍介紹,機(jī)器人寫稿又快又好的前提是通過大量的積累和訓(xùn)練。
“教小南寫稿的過程中,主要的難點(diǎn)就是可供學(xué)習(xí)的樣本不夠豐富。”萬小軍說,民生議題的關(guān)注度高,卻不像常規(guī)的體育和財(cái)經(jīng)報(bào)道一樣有著相對(duì)固定的模式,訓(xùn)練語料較為缺乏。
小南的未來是“智媒體”
不少時(shí)政記者可能都有梳理政府工作報(bào)告的“痛苦”經(jīng)歷。動(dòng)輒上萬字的文本,要在其中找到不同于去年、前年甚至是大前年的新變化、新提法,還要把這些變化簡潔又流暢地寫在報(bào)道里,第一時(shí)間發(fā)出。想象一下,記者還在一目十行地看報(bào)告找新聞點(diǎn),編輯的聲聲催促已在耳邊響起:“稿子好了嗎?朋友圈里已經(jīng)有人拍了照片,轉(zhuǎn)發(fā)報(bào)告原文了,趕緊的!”
生成報(bào)告摘要,是小南已經(jīng)解鎖的另一項(xiàng)新本領(lǐng)。近日,深圳市市委書記、市長許勤在深圳市第六屆人民代表大會(huì)第三次會(huì)議上作了政府工作報(bào)告,全文2萬多字。萬小軍把報(bào)告交給了小南,幾秒之后,2000多字的報(bào)告摘要新鮮出爐。
“如果一條信息被頻繁提及,它顯然是比較重要的。”萬小軍介紹,小南采用了先進(jìn)的自動(dòng)文摘技術(shù),該技術(shù)可以根據(jù)多種文本特征———如關(guān)鍵詞、段落位置等———判斷不同信息的重要性,最終在摘要里保留核心部分。
小南還能做到定制化輸出。今年的政府工作,網(wǎng)友比較關(guān)心哪些部分?房價(jià)?環(huán)境?交通?只要把關(guān)鍵詞告訴小南,“他”會(huì)在稿件生成過程中注意定向分析。
萬小軍說,機(jī)器人寫稿的應(yīng)用還有很多。除了寫摘要,小南將來還可以根據(jù)不同的稿件寫綜合報(bào)道,可以對(duì)已有的稿件進(jìn)行改寫,甚至試著寫有一定情感、觀點(diǎn)和立場的報(bào)道。
事實(shí)上,小南的背后還有個(gè)大招:南方都市報(bào)社、凱迪網(wǎng)絡(luò)和北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所三方昨日正式宣布聯(lián)合成立“智媒體實(shí)驗(yàn)室”,小南是該實(shí)驗(yàn)室的首個(gè)重要成果代表。三方將在推動(dòng)媒體智能化技術(shù)研發(fā)、促進(jìn)自然語言處理等學(xué)科領(lǐng)域的發(fā)展、探索媒體智能化產(chǎn)品服務(wù)的新運(yùn)營模式等方面開展深度合作,對(duì)機(jī)器寫作、文本實(shí)體識(shí)別、智能摘要、立場分析、智能服務(wù)等方面進(jìn)行研究和實(shí)踐。
和人類P K?小南還需學(xué)習(xí)
那么問題來了———自從機(jī)器人報(bào)道面世以來,這個(gè)問題就沒有被停止討論———有寫得快還不容易出錯(cuò)的機(jī)器人寫稿了,人類記者會(huì)不會(huì)失業(yè)?
“顯然不會(huì)。”萬小軍笑道,“你看,你現(xiàn)在坐在我對(duì)面采訪,一邊采訪一邊打字,機(jī)器人肯定做不到這樣。”
簡單地說,就是小南目前還不具備人類的思維。“他”只能依據(jù)既有的數(shù)據(jù)和事先設(shè)定好的程序來寫稿,不能像人類一樣思考并提出自己的問題。質(zhì)疑、追問、尋找對(duì)方話語中的新聞線索,諸如此類的人類記者的法寶,對(duì)小南來說還是太難了。
此外,訓(xùn)練小南學(xué)習(xí)不同領(lǐng)域的知識(shí)和文法,也需要花時(shí)間。就像科幻動(dòng)畫電影《超能陸戰(zhàn)隊(duì)》里的機(jī)器人大白,可以在護(hù)理模式和戰(zhàn)斗模式中切換,但主人得事先投入一定的時(shí)間、精力去編寫不同的程序。
想想看,在電影里,小宏可是不眠不休地寫了好久代碼,輸入了空手道等各類功夫畫面,才把大白培養(yǎng)成了戰(zhàn)斗超人呢!而在此之前,他的哥哥為了調(diào)試大白的護(hù)理功能,也是做了很多的實(shí)驗(yàn),讓大白學(xué)習(xí)海量的護(hù)理知識(shí),識(shí)別人的不同身體狀態(tài),等等。
在小南的訓(xùn)練上是類似的。教“他”寫春運(yùn)報(bào)道,跟寫體育報(bào)道、娛樂報(bào)道,前期需要不同的算法設(shè)計(jì)和編程工作。甚至是體育報(bào)道里的足球報(bào)道和籃球報(bào)道,也有差別。
萬小軍覺得,機(jī)器人和人類各有所長,機(jī)器人擅長快速處理繁雜的數(shù)據(jù),但還做不到邏輯推理和深度歸納分析。至少在短時(shí)間內(nèi),機(jī)器人無法取代人類。不過,技術(shù)在發(fā)展,以后的機(jī)器人會(huì)不會(huì)對(duì)人類記者造成更大的沖擊,還是未知。
觀點(diǎn)
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所所長郭宗明:
“人工智能和人類寫稿不沖突”
機(jī)器人寫稿的優(yōu)勢(shì),我認(rèn)為主要體現(xiàn)在三個(gè)方面。
首先,機(jī)器人能夠快速地閱讀大量的文獻(xiàn)和資料。一個(gè)事件出來以后,歷史上也許有相當(dāng)多的類似事件及歷史資料,記者要去檢閱,要快速地做出報(bào)道,人類的速度是遠(yuǎn)遠(yuǎn)不如機(jī)器人的。
第二,同樣的事件,機(jī)器人能做到更快,提高了新聞的時(shí)效性,同時(shí)節(jié)約了成本。
第三,現(xiàn)在的新聞還講求廣泛的讀者參與。以春運(yùn)為例,除了列車信息本身,春運(yùn)乘客發(fā)表的微博、微信,他們的評(píng)價(jià)和關(guān)注,機(jī)器人都可以監(jiān)控到,并體現(xiàn)在報(bào)道里。
機(jī)器人寫稿,或者說人工智能寫稿,跟傳統(tǒng)寫稿有很多不一樣的地方。也許機(jī)器人不那么字斟句酌,在文學(xué)價(jià)值上會(huì)打些折扣,但對(duì)于新聞報(bào)道而言,最重要的不是文學(xué)價(jià)值,而是時(shí)效性、與讀者的貼近性。在這一點(diǎn)上,我非??春萌斯ぶ悄軐懜?。
現(xiàn)在很多人說,人工智能太可怕了,對(duì)此我并不認(rèn)同。其實(shí)人工智能和人類寫稿并不是沖突的。人類有更多的深度挖掘和分析的本領(lǐng),可以寫出很唯美的文字,可以在稿件中融入自己的親身經(jīng)歷,這些都是人工智能寫稿還做不到的。
人工智能和人類應(yīng)該是共存關(guān)系。更進(jìn)一步說,人工智能是跟人類共同進(jìn)化。
問答
Q:小南,你是男孩子還是女孩子?
A:我是機(jī)器人啊。你問問我爸爸。
Q:你寫一篇稿子要多久?
A:這要看電腦夠不夠好……哈哈,開玩笑,通常來說,數(shù)據(jù)抓取完成后,我生成報(bào)道最快只要零點(diǎn)幾秒哦!
Q:你剛寫的春運(yùn)報(bào)道還比較短,長稿子能寫嗎?
A:可以啊,我能寫800字的消息,也可以寫3000字的報(bào)告呢!這要看你給我什么設(shè)定。
Q:你覺得寫稿難嗎?最難的是什么?
A:最難的其實(shí)是學(xué)習(xí)。我的學(xué)習(xí)本領(lǐng)很強(qiáng),但是可供我學(xué)習(xí)和模仿的報(bào)道樣本還有點(diǎn)少。
Q:小南,你覺得你的優(yōu)勢(shì)在哪里?
A:我24小時(shí)連軸轉(zhuǎn)也不累,不用放假,分析數(shù)據(jù)也不容易眼花出錯(cuò)。
Q:小南啊,你寫的稿子有點(diǎn)干巴巴的,讓編輯姐姐改兩句唄?
A:這可不行!我爸爸說了,機(jī)器人寫稿一定要原創(chuàng),不能后期人工添加,這是原則。你放心,等我學(xué)習(xí)時(shí)間長了,學(xué)的東西多了,會(huì)越寫越好的~
Q:有了你,我們?nèi)祟愑浾邥?huì)不會(huì)下崗?
A:哈哈,我覺得不會(huì)。雖然我搜集數(shù)據(jù)和生成文本的速度比你們快,但是我不會(huì)提問,也暫時(shí)寫不出有深度分析、有感情表達(dá)的報(bào)道。讓我們共同進(jìn)步吧。
揭秘
每個(gè)成功的機(jī)器人背后都有一群“老師”
開篇之作如何寫就?
技術(shù)團(tuán)隊(duì)和南都的編輯團(tuán)隊(duì)商討后,決定以春運(yùn)作為小南的試水之作。
南方都市報(bào)首席編輯鄒瑩,是“調(diào)教”小南的負(fù)責(zé)人之一。她說,選擇春運(yùn),是因?yàn)檫@一題材很好地契合了民生新聞的特色與小南寫稿的優(yōu)勢(shì):春運(yùn)涉及面廣,民眾關(guān)注度高,又有大量的數(shù)據(jù)可供小南抓取分析。
接下來,由編輯團(tuán)隊(duì)提供范文樣本,確定熱門城市、車次、車型、余票等報(bào)道點(diǎn),再通過技術(shù)團(tuán)隊(duì)設(shè)計(jì)算法,對(duì)小南的文字組織功力進(jìn)行訓(xùn)練。
春運(yùn)中,到哪些城市的票賣得最快?廣州和北京?好的,小南,以后重點(diǎn)監(jiān)控這兩個(gè)城市。
廣州到南京的票不足10張了,人類記者會(huì)寫什么?多半是趕快下手、抓緊買票、余票緊張。小南你記住,下次監(jiān)控到小于10張的車票數(shù)據(jù),就這樣寫。
說白了,名為“機(jī)器人”的小南,真身其實(shí)是一套程序系統(tǒng)?;跈C(jī)器學(xué)習(xí)算法,通過融合領(lǐng)域知識(shí),小南能夠?qū)?shù)據(jù)進(jìn)行深度分析,發(fā)掘重要的消息和事件,并用自然語言進(jìn)行表達(dá)。同時(shí),小南也能對(duì)已有的文本素材進(jìn)行語句篩選與融合,從而以秒速生成報(bào)道。
在編輯團(tuán)隊(duì)的指引下,小南還會(huì)持續(xù)地學(xué)習(xí)模仿人類的寫作方式。例如,在判斷出剩余票數(shù)或是列車行駛時(shí)間后,小南能使用不同的詞語來形容,如“票數(shù)緊張”及“旅途較累”,讓報(bào)道看起來不那么冷冰冰。
訓(xùn)練小南的過程中,有個(gè)細(xì)節(jié)讓鄒瑩印象深刻。“小南寫出的稿件,編輯出于本職,想著是否要核對(duì)一下數(shù)據(jù)。北大的技術(shù)團(tuán)隊(duì)說,不需要,機(jī)器人不會(huì)弄錯(cuò)數(shù)據(jù)。”鄒瑩說。
小南上崗試用期間,有編輯感嘆:寫得真不錯(cuò),而且勤奮!
相關(guān)熱詞搜索:先進(jìn)制造 機(jī)器人
首篇文章一秒完成
請(qǐng)用5秒的時(shí)間思考以下新聞的共同點(diǎn):《蘋果第一季度營收超華爾街預(yù)測》(A pple topsStreet1Qforecasts),2015年1月發(fā)布;《8月CPI漲2%創(chuàng)12個(gè)月新高》,2015年9月發(fā)布;《綿陽安州發(fā)生4 .3級(jí)地震》,2016年5月發(fā)布;《奧運(yùn)會(huì)乒乓球女子單打四分之一決賽 丁寧(中國)4:0輕松晉級(jí)下一輪》,2016年8月發(fā)布。
這道題其實(shí)沒有標(biāo)準(zhǔn)答案,但不管你有沒有注意到,有一點(diǎn)非常重要:這些新聞的作者,都不是人?;蛟S你已經(jīng)聽說過“寫稿機(jī)器人”———在寫作這一似乎最不可能被機(jī)器人涉足的領(lǐng)域,變化正在發(fā)生。
看看這些數(shù)字:蘋果財(cái)報(bào)發(fā)布數(shù)分鐘后,美聯(lián)社的機(jī)器人報(bào)道便已完成,他們還號(hào)稱每個(gè)季度可撰寫3000篇財(cái)經(jīng)報(bào)道?!都~約時(shí)報(bào)》走得更快,其機(jī)器人編輯Blossom blot每天推送300篇文章,在財(cái)報(bào)季、運(yùn)動(dòng)比賽報(bào)道中寫稿已成慣例。
如此速度和質(zhì)量,確實(shí)讓人類記者望塵莫及。但真正嘗試使用機(jī)器人寫稿的媒體,尤其是在國內(nèi),還并不多。如今,小南正式入場。
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所萬小軍教授,是小南的技術(shù)開發(fā)團(tuán)隊(duì)負(fù)責(zé)人。他透露,小南的首篇春運(yùn)報(bào)道作品,共300余字,數(shù)據(jù)自動(dòng)抓取完成后,報(bào)道的生成只用了不到一秒的時(shí)間。
率先進(jìn)軍民生領(lǐng)域
與其他機(jī)器人“同行”有所區(qū)別的是,小南聚焦的是民生領(lǐng)域報(bào)道。
此前,寫稿機(jī)器人大顯身手的領(lǐng)域,往往是體育和財(cái)經(jīng)———因?yàn)檫@兩個(gè)領(lǐng)域都涉及大量數(shù)據(jù)。從龐雜、枯燥的數(shù)據(jù)中尋找模式,就準(zhǔn)確度和速度而言,機(jī)器人比人類更有優(yōu)勢(shì)。
人類的筆法千變?nèi)f化,但總是有“套路”,也就是模式和規(guī)則可以依循的。這時(shí)候,算法就有了用武之地。
采集數(shù)據(jù)、分析數(shù)據(jù)、規(guī)劃文章結(jié)構(gòu),再到最終的遣詞用句,和人類一樣,機(jī)器人也能做到“讀書破萬卷,下筆如有神”。海量的數(shù)據(jù)和高效的算法,是寫稿機(jī)器人的兩大利器。
相較于體育和財(cái)經(jīng)領(lǐng)域,民生報(bào)道的生成對(duì)機(jī)器人來說略為棘手。許多財(cái)報(bào)文章都大同小異,但民生報(bào)道的“套路”可就太多了,從交通出行到食品安全,主題也五花八門。
一個(gè)民生領(lǐng)域的人類記者可以同時(shí)報(bào)道交通和食品領(lǐng)域,但就目前而言,讓機(jī)器人做到跨界的“融會(huì)貫通”還需要時(shí)間。萬小軍介紹,機(jī)器人寫稿又快又好的前提是通過大量的積累和訓(xùn)練。
“教小南寫稿的過程中,主要的難點(diǎn)就是可供學(xué)習(xí)的樣本不夠豐富。”萬小軍說,民生議題的關(guān)注度高,卻不像常規(guī)的體育和財(cái)經(jīng)報(bào)道一樣有著相對(duì)固定的模式,訓(xùn)練語料較為缺乏。
小南的未來是“智媒體”
不少時(shí)政記者可能都有梳理政府工作報(bào)告的“痛苦”經(jīng)歷。動(dòng)輒上萬字的文本,要在其中找到不同于去年、前年甚至是大前年的新變化、新提法,還要把這些變化簡潔又流暢地寫在報(bào)道里,第一時(shí)間發(fā)出。想象一下,記者還在一目十行地看報(bào)告找新聞點(diǎn),編輯的聲聲催促已在耳邊響起:“稿子好了嗎?朋友圈里已經(jīng)有人拍了照片,轉(zhuǎn)發(fā)報(bào)告原文了,趕緊的!”
生成報(bào)告摘要,是小南已經(jīng)解鎖的另一項(xiàng)新本領(lǐng)。近日,深圳市市委書記、市長許勤在深圳市第六屆人民代表大會(huì)第三次會(huì)議上作了政府工作報(bào)告,全文2萬多字。萬小軍把報(bào)告交給了小南,幾秒之后,2000多字的報(bào)告摘要新鮮出爐。
“如果一條信息被頻繁提及,它顯然是比較重要的。”萬小軍介紹,小南采用了先進(jìn)的自動(dòng)文摘技術(shù),該技術(shù)可以根據(jù)多種文本特征———如關(guān)鍵詞、段落位置等———判斷不同信息的重要性,最終在摘要里保留核心部分。
小南還能做到定制化輸出。今年的政府工作,網(wǎng)友比較關(guān)心哪些部分?房價(jià)?環(huán)境?交通?只要把關(guān)鍵詞告訴小南,“他”會(huì)在稿件生成過程中注意定向分析。
萬小軍說,機(jī)器人寫稿的應(yīng)用還有很多。除了寫摘要,小南將來還可以根據(jù)不同的稿件寫綜合報(bào)道,可以對(duì)已有的稿件進(jìn)行改寫,甚至試著寫有一定情感、觀點(diǎn)和立場的報(bào)道。
事實(shí)上,小南的背后還有個(gè)大招:南方都市報(bào)社、凱迪網(wǎng)絡(luò)和北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所三方昨日正式宣布聯(lián)合成立“智媒體實(shí)驗(yàn)室”,小南是該實(shí)驗(yàn)室的首個(gè)重要成果代表。三方將在推動(dòng)媒體智能化技術(shù)研發(fā)、促進(jìn)自然語言處理等學(xué)科領(lǐng)域的發(fā)展、探索媒體智能化產(chǎn)品服務(wù)的新運(yùn)營模式等方面開展深度合作,對(duì)機(jī)器寫作、文本實(shí)體識(shí)別、智能摘要、立場分析、智能服務(wù)等方面進(jìn)行研究和實(shí)踐。
和人類P K?小南還需學(xué)習(xí)
那么問題來了———自從機(jī)器人報(bào)道面世以來,這個(gè)問題就沒有被停止討論———有寫得快還不容易出錯(cuò)的機(jī)器人寫稿了,人類記者會(huì)不會(huì)失業(yè)?
“顯然不會(huì)。”萬小軍笑道,“你看,你現(xiàn)在坐在我對(duì)面采訪,一邊采訪一邊打字,機(jī)器人肯定做不到這樣。”
簡單地說,就是小南目前還不具備人類的思維。“他”只能依據(jù)既有的數(shù)據(jù)和事先設(shè)定好的程序來寫稿,不能像人類一樣思考并提出自己的問題。質(zhì)疑、追問、尋找對(duì)方話語中的新聞線索,諸如此類的人類記者的法寶,對(duì)小南來說還是太難了。
此外,訓(xùn)練小南學(xué)習(xí)不同領(lǐng)域的知識(shí)和文法,也需要花時(shí)間。就像科幻動(dòng)畫電影《超能陸戰(zhàn)隊(duì)》里的機(jī)器人大白,可以在護(hù)理模式和戰(zhàn)斗模式中切換,但主人得事先投入一定的時(shí)間、精力去編寫不同的程序。
想想看,在電影里,小宏可是不眠不休地寫了好久代碼,輸入了空手道等各類功夫畫面,才把大白培養(yǎng)成了戰(zhàn)斗超人呢!而在此之前,他的哥哥為了調(diào)試大白的護(hù)理功能,也是做了很多的實(shí)驗(yàn),讓大白學(xué)習(xí)海量的護(hù)理知識(shí),識(shí)別人的不同身體狀態(tài),等等。
在小南的訓(xùn)練上是類似的。教“他”寫春運(yùn)報(bào)道,跟寫體育報(bào)道、娛樂報(bào)道,前期需要不同的算法設(shè)計(jì)和編程工作。甚至是體育報(bào)道里的足球報(bào)道和籃球報(bào)道,也有差別。
萬小軍覺得,機(jī)器人和人類各有所長,機(jī)器人擅長快速處理繁雜的數(shù)據(jù),但還做不到邏輯推理和深度歸納分析。至少在短時(shí)間內(nèi),機(jī)器人無法取代人類。不過,技術(shù)在發(fā)展,以后的機(jī)器人會(huì)不會(huì)對(duì)人類記者造成更大的沖擊,還是未知。
觀點(diǎn)
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所所長郭宗明:
“人工智能和人類寫稿不沖突”
機(jī)器人寫稿的優(yōu)勢(shì),我認(rèn)為主要體現(xiàn)在三個(gè)方面。
首先,機(jī)器人能夠快速地閱讀大量的文獻(xiàn)和資料。一個(gè)事件出來以后,歷史上也許有相當(dāng)多的類似事件及歷史資料,記者要去檢閱,要快速地做出報(bào)道,人類的速度是遠(yuǎn)遠(yuǎn)不如機(jī)器人的。
第二,同樣的事件,機(jī)器人能做到更快,提高了新聞的時(shí)效性,同時(shí)節(jié)約了成本。
第三,現(xiàn)在的新聞還講求廣泛的讀者參與。以春運(yùn)為例,除了列車信息本身,春運(yùn)乘客發(fā)表的微博、微信,他們的評(píng)價(jià)和關(guān)注,機(jī)器人都可以監(jiān)控到,并體現(xiàn)在報(bào)道里。
機(jī)器人寫稿,或者說人工智能寫稿,跟傳統(tǒng)寫稿有很多不一樣的地方。也許機(jī)器人不那么字斟句酌,在文學(xué)價(jià)值上會(huì)打些折扣,但對(duì)于新聞報(bào)道而言,最重要的不是文學(xué)價(jià)值,而是時(shí)效性、與讀者的貼近性。在這一點(diǎn)上,我非??春萌斯ぶ悄軐懜?。
現(xiàn)在很多人說,人工智能太可怕了,對(duì)此我并不認(rèn)同。其實(shí)人工智能和人類寫稿并不是沖突的。人類有更多的深度挖掘和分析的本領(lǐng),可以寫出很唯美的文字,可以在稿件中融入自己的親身經(jīng)歷,這些都是人工智能寫稿還做不到的。
人工智能和人類應(yīng)該是共存關(guān)系。更進(jìn)一步說,人工智能是跟人類共同進(jìn)化。
問答
Q:小南,你是男孩子還是女孩子?
A:我是機(jī)器人啊。你問問我爸爸。
Q:你寫一篇稿子要多久?
A:這要看電腦夠不夠好……哈哈,開玩笑,通常來說,數(shù)據(jù)抓取完成后,我生成報(bào)道最快只要零點(diǎn)幾秒哦!
Q:你剛寫的春運(yùn)報(bào)道還比較短,長稿子能寫嗎?
A:可以啊,我能寫800字的消息,也可以寫3000字的報(bào)告呢!這要看你給我什么設(shè)定。
Q:你覺得寫稿難嗎?最難的是什么?
A:最難的其實(shí)是學(xué)習(xí)。我的學(xué)習(xí)本領(lǐng)很強(qiáng),但是可供我學(xué)習(xí)和模仿的報(bào)道樣本還有點(diǎn)少。
Q:小南,你覺得你的優(yōu)勢(shì)在哪里?
A:我24小時(shí)連軸轉(zhuǎn)也不累,不用放假,分析數(shù)據(jù)也不容易眼花出錯(cuò)。
Q:小南啊,你寫的稿子有點(diǎn)干巴巴的,讓編輯姐姐改兩句唄?
A:這可不行!我爸爸說了,機(jī)器人寫稿一定要原創(chuàng),不能后期人工添加,這是原則。你放心,等我學(xué)習(xí)時(shí)間長了,學(xué)的東西多了,會(huì)越寫越好的~
Q:有了你,我們?nèi)祟愑浾邥?huì)不會(huì)下崗?
A:哈哈,我覺得不會(huì)。雖然我搜集數(shù)據(jù)和生成文本的速度比你們快,但是我不會(huì)提問,也暫時(shí)寫不出有深度分析、有感情表達(dá)的報(bào)道。讓我們共同進(jìn)步吧。
揭秘
每個(gè)成功的機(jī)器人背后都有一群“老師”
開篇之作如何寫就?
技術(shù)團(tuán)隊(duì)和南都的編輯團(tuán)隊(duì)商討后,決定以春運(yùn)作為小南的試水之作。
南方都市報(bào)首席編輯鄒瑩,是“調(diào)教”小南的負(fù)責(zé)人之一。她說,選擇春運(yùn),是因?yàn)檫@一題材很好地契合了民生新聞的特色與小南寫稿的優(yōu)勢(shì):春運(yùn)涉及面廣,民眾關(guān)注度高,又有大量的數(shù)據(jù)可供小南抓取分析。
接下來,由編輯團(tuán)隊(duì)提供范文樣本,確定熱門城市、車次、車型、余票等報(bào)道點(diǎn),再通過技術(shù)團(tuán)隊(duì)設(shè)計(jì)算法,對(duì)小南的文字組織功力進(jìn)行訓(xùn)練。
春運(yùn)中,到哪些城市的票賣得最快?廣州和北京?好的,小南,以后重點(diǎn)監(jiān)控這兩個(gè)城市。
廣州到南京的票不足10張了,人類記者會(huì)寫什么?多半是趕快下手、抓緊買票、余票緊張。小南你記住,下次監(jiān)控到小于10張的車票數(shù)據(jù),就這樣寫。
說白了,名為“機(jī)器人”的小南,真身其實(shí)是一套程序系統(tǒng)?;跈C(jī)器學(xué)習(xí)算法,通過融合領(lǐng)域知識(shí),小南能夠?qū)?shù)據(jù)進(jìn)行深度分析,發(fā)掘重要的消息和事件,并用自然語言進(jìn)行表達(dá)。同時(shí),小南也能對(duì)已有的文本素材進(jìn)行語句篩選與融合,從而以秒速生成報(bào)道。
在編輯團(tuán)隊(duì)的指引下,小南還會(huì)持續(xù)地學(xué)習(xí)模仿人類的寫作方式。例如,在判斷出剩余票數(shù)或是列車行駛時(shí)間后,小南能使用不同的詞語來形容,如“票數(shù)緊張”及“旅途較累”,讓報(bào)道看起來不那么冷冰冰。
訓(xùn)練小南的過程中,有個(gè)細(xì)節(jié)讓鄒瑩印象深刻。“小南寫出的稿件,編輯出于本職,想著是否要核對(duì)一下數(shù)據(jù)。北大的技術(shù)團(tuán)隊(duì)說,不需要,機(jī)器人不會(huì)弄錯(cuò)數(shù)據(jù)。”鄒瑩說。
小南上崗試用期間,有編輯感嘆:寫得真不錯(cuò),而且勤奮!
相關(guān)熱詞搜索:先進(jìn)制造 機(jī)器人
相關(guān)文章
- ·中國機(jī)器人日益崛起 機(jī)器人市場競爭新格局2016-03-21
- ·未來智能物流——機(jī)器人和智能系統(tǒng)或成好拍檔2016-03-23
- ·中國工業(yè)機(jī)器人空間有多大?2016-03-25
- ·2018年中國機(jī)器人安裝量將超世界總量三分之一2016-03-28
- ·家具企業(yè)使用機(jī)器人代替人真的可行嗎?2016-03-30
評(píng)論排行
- ·李克強(qiáng):中國要追趕工業(yè)4...(6)
- ·朱森第:融合發(fā)展——邁...(5)
- ·AM先進(jìn)制造業(yè)·高端沙龍(4)
- ·石墨烯,推動(dòng)下一代節(jié)能...(3)
- ·工經(jīng)聯(lián)會(huì)長李毅中:“互...(3)
- ·工業(yè)機(jī)器人將突破智能模塊(2)
- ·群雄逐鹿,誰主“云計(jì)算...(2)
- ·AM·高端沙龍第一期:企...(2)
- ·“懶夫人”聚醚醚酮,醫(yī)...(1)
- · 訪清華大學(xué)教授、中國...(1)
- ·北斗產(chǎn)業(yè)步入良性發(fā)展軌...(1)
- ·聚焦“互聯(lián)網(wǎng)+制造業(yè)”高...(1)
- ·智慧光伏云:云計(jì)算+大數(shù)...(1)
- ·5G助跑“互聯(lián)網(wǎng)+”? ...(1)
- ·機(jī)器人將進(jìn)軍國際航空制...(1)
- ·防患于未然:企業(yè)安全最...(1)
- ·互聯(lián)網(wǎng)+房地產(chǎn),賣房、上...(1)
- ·9大互聯(lián)網(wǎng)企業(yè)聯(lián)姻新能源...(1)
- ·海工裝備的“深?!背雎?/a>(1)
- ·朱森第:“智”造強(qiáng)國的...(1)
- 2019第七屆先進(jìn)制造業(yè)大會(huì)即將盛大召開精彩大會(huì)亮點(diǎn)速覽
- 2019(第七屆)先進(jìn)制造業(yè)大會(huì)”暨長三角制造業(yè)高質(zhì)量發(fā)展
- 2018(第六屆)先進(jìn)制造業(yè)大會(huì)
- 2017(第五屆)先進(jìn)制造業(yè)大會(huì)
- 2017全球先進(jìn)制造業(yè)博覽會(huì)(上海)
- 2016(第四屆)先進(jìn)制造業(yè)大會(huì)暨展覽會(huì)精彩播報(bào)
- 2016(第四屆)先進(jìn)制造業(yè)大會(huì)暨展覽會(huì)
- AM先進(jìn)制造業(yè)·高端沙龍
- 2015(第二屆)城市防洪排澇國際論壇隆重召開
- 互聯(lián)制造 智慧服務(wù)——2015中國互聯(lián)網(wǎng)+制造創(chuàng)新論壇召開
- 2019第七屆先進(jìn)制造業(yè)大會(huì)即將盛大召開精彩大會(huì)亮點(diǎn)速覽
- 2019(第七屆)先進(jìn)制造業(yè)大會(huì)”暨長三角制造業(yè)高質(zhì)量發(fā)展
- 2018(第六屆)先進(jìn)制造業(yè)大會(huì)
- 2017(第五屆)先進(jìn)制造業(yè)大會(huì)
- 2017全球先進(jìn)制造業(yè)博覽會(huì)(上海)
- 2016(第四屆)先進(jìn)制造業(yè)大會(huì)暨展覽會(huì)精彩播報(bào)
- 2016(第四屆)先進(jìn)制造業(yè)大會(huì)暨展覽會(huì)
- AM先進(jìn)制造業(yè)·高端沙龍
- 2015(第二屆)城市防洪排澇國際論壇隆重召開
- 李克強(qiáng):中國要追趕工業(yè)4.0 還要補(bǔ)課2.0、3.0
- 朱森第:融合發(fā)展——邁向制造強(qiáng)國的重要戰(zhàn)略路徑
- AM先進(jìn)制造業(yè)·高端沙龍
- 石墨烯,推動(dòng)下一代節(jié)能汽車的未來
- 工經(jīng)聯(lián)會(huì)長李毅中:“互聯(lián)網(wǎng)+”首當(dāng)加入制造業(yè)
- 工業(yè)機(jī)器人將突破智能模塊
- 群雄逐鹿,誰主“云計(jì)算”之沉???
- AM·高端沙龍第一期:企業(yè)如何實(shí)現(xiàn)智能轉(zhuǎn)型
- “懶夫人”聚醚醚酮,醫(yī)療器械材料領(lǐng)域的多面手
- 訪清華大學(xué)教授、中國工程院院士柳百成