June 21, 2009

看見古書,Google Book Search


女兒是《傲慢與偏見》的書迷,她看了幾本中文翻譯書後,覺得各書中的情節略有不同,雖還沒有到矛盾的地步,但對主角的描述,總有隔一層的感覺。她吵著要看原文書,因記得老家有此書,就拖著沒幫她買,懶媽媽最後鬧不過她,只好告訴她,用Google Book Search(圖書搜尋),就可找到原文書來看。

這一找,哇,1853年1813年的書都赫然在列。她看到150歲以上的原文書模樣(封面、內頁、空白頁...全都有),驚呼連連,鮮少上圖書館領略老書的她,這真是有趣的經驗。

然後我和她說起,Google一直在執行的計畫,就是掃描全球知名圖書館內的絕版書,讓遠在天涯的一本古書,也能藉由現代科技和網路,重現在她眼前。

那Google到底是怎麼做到的?Google的掃描機器長什麼樣子?我也一直很好奇,就來搜看看。找到以下影片,終於明白。



影片中所看到的「掃描機」,和家用的平板式機器截然不同。由兩台隨時可替換的、目前最棒的數位相機擔任「掃描」工作,一次替書本的每一跨頁分別拍下照片。機器翻頁迅速,但感覺很溫柔。當然從影片中也看到,所使用的軟體介面,似乎在微軟環境上。



書一頁頁拍好照之後,需QC(quality control),經適當地調整校正後,再經QA(quality assurance),確認一切無誤,符合良好品質標準後,才算完成,才能上線。影片中專門將書籍數位化的Kirtas公司表示,他們一天可掃描百本圖書,較花人力的QC工作,一天只能完成30本書,QA則一天能處理120-140本。

本來躺在圖書館裡灰塵滿佈的絕版書,經「掃描」後,可變成數位內容或電子書(ebook),經由搜尋工具,增加與世人見面的機會。不只絕版古書, 只要作者、書商願意,也可加入Google圖書搜尋計畫,成為圖書搜尋夥伴。從搜尋結果看來,可以很清楚的看出,Google圖書搜尋有三種呈現方式:(參考最前面一張圖)
1. 絕版無版權的書,整本書全文呈現,書頁下邊無廣告
2. 有版權的書,摘錄顯示,書頁下邊有廣告(?)
3. 參加夥伴計畫的書,出版商可自定顯示頁面多寡,書頁下邊是否要有廣告呈現

我和女兒說,美國作家協會和美國出版社協會與Google為了圖書搜尋而打官司。網路原生代的她,突然很激動地回我,「為什麼要告Google,白痴啊?!我在Google中只是看看罷了,真的喜歡,我一定會去買一本回來啊!沒有Google幫我,我哪知道我到底愛不愛這本書!這就和那些在YouTube上的影片一樣,每次我看到喜歡歌手的影片,不久就會變成在你的國家不能播,爛透了,我看了影片,我喜歡那歌手,歌手來台灣演唱,才會有那麼多人擠破頭去看演唱會啊!」

我很驚訝,她把圖書搜尋的事情和YouTube的消失影片串在一起(YouTube影片對她來說,比書重要很多)。但很顯然的,這些從小就有網路的小孩,沒有地域觀念,語言的隔閡幾乎也不是問題。管他英文還是日文,只要能看、能聽就好,只要喜歡,自然就會懂。文字、歌曲、影片和影像都一樣,在瀏覽器中滿足他們的視聽需求,真正打動心中的甜蜜點後,自然就會花錢買回家。

當然她不懂出版社和Google間的利益糾葛,甚至不了解Google組織全球資訊的野心,Google也許沒做壞事,但所有的資訊只在一家公司手上,是不是太冒險了一點?她也沒了解,如果她想買一本書,從搜尋頁面點選網路書店的連結,Google可以賺到廣告費,而從那頁面直接買書的話,Google可分到37%的營收。(未來若直接買電子書的話,會怎麼算呢?)

根據目前美國法院所判的「Google圖書搜尋訴訟和解方案」,作者或出版商需在2009年9月4日提出異議(也可選擇opt-out,選擇退出和解,不願接受賠償,也放棄對Google的訴訟,也意味著可選擇書籍內容不出現在搜尋結果之上);同時Google需成立獨立且非盈利的「書籍權利登記中心」(Book Rights Registry)。作者、出版社、版權擁有者需在此處登記註冊,方便Google分配賠償金額,或未來圖書搜尋的廣告報酬,或更以後的來來,販售電子書的版權費?

雖然我們總是覺得目前網路上的資訊,數不盡也看不完。但是這些資訊,了不起從1960年代開始集結。在這之前,人類的知識精華都在一本本的書冊之上。最經典的、最重要的、最優美的文字與資訊都躺在圖書館內的書架上。站在推廣知識的角度上,Google Book Search也許最讓圖書館和愛書人得益。得益不等同得利,將所有的書籍數位化上網,成為網路資訊,成為數位內容或可購買的電子書,這有可能成為圖書館的另一種收入嗎?或是讓可以連到網路上的所有人都得到最優質的搜尋結果(最好的知識內容)?

無版權的公版古書、有版權的已絕版書(原先僅能在二手書市尋覓)也得以因為數位化和圖書搜尋技術,而有不同的生命出口,這些都是好事,但如果全球只有一家公司能做好這件事情,只有一家公司有能力做這件事情,我們也只能祈求Google永遠不倒店、Google永遠不做惡!

延伸閱讀:
Google's digital-book future hangs in the balance
Publisher speculates about Amazon/Google e-book "duopoly"
Google圖書搜尋新功能
‧非常複雜的Google圖書搜尋和解方案,希望我沒有看錯
繁體中文版的圖書搜尋夥伴計畫


1853年的傲慢與偏見,來自紐約市立圖書館


1813年的傲慢與偏見,牛津大學的藏書

6 comments:

  1. 原來牛津大學的是第二冊以為怎麼不一樣呢~

    可以讓女兒看BBC拍的影集,我覺得很好看(youtube上應該找的到:P)

    權力集中在一家公司其實還蠻可怕的,誰曉得以後會怎樣。

    跳開話題談幾年前美國審判幾家網路公司,包括google為了利益將與中國協商甚至公開個人資料給中國政府(Yahoo!)就覺得很要命很可怕>< [Cisco甚至販售中國情資搜尋、定位等工具]

    ReplyDelete
  2. Cait, 故意embed,是想強調Google book search的功能。另,若scroll embed的頁面,到前面,可看到書本的封面、條碼、印章等。也看到兩本書年代不同的印刷方式。

    她不是不知道內容,還有自己的體悟。只是她覺得翻譯書的對話,怪怪的,讓人物性格不能連貫,所以想看原文到底是怎麼寫的。看不看BBC到還好,等基測考完,今年暑假應會鼓勵她看完這本的原文書。甚至鼓勵她自己翻翻看。

    我一向不會不喜Google,但是若能有兩、三個選擇,而不是一家獨大,總是比較好。但商業上,似乎極大之後,才有利可圖,不然好像都只是在燒錢而已。Google說不定也認為,自己還在燒錢,根本在圖書搜尋這邊還在做慈善事業呢!

    ReplyDelete
  3. 我覺得特別可惜的是台灣沒有任何單位,圖書館、數位典藏計畫願意做公共領域中文圖書的掃描作業。像Google做英文書的事。

    ReplyDelete
  4. Dear oc,

    Google應該有幫台大圖書館做,但是何時會上網,真的不知道,中文的QC和QA不容易!我在中文的圖書搜尋中,看不到想像中的絕版書。

    是,圖書館似乎應該有預算做數位化古籍的工作,但也沒看到有什麼結果...。

    ReplyDelete
  5. 大大,這個和解方案不是法院判決的,是和解的暫時結果。整個和解協議,最終還要送交法院核准,案子才算告一段落....

    ReplyDelete
  6. Hi 克里斯,

    目前的settlement,寫成判(我好像沒有寫決),就是因為不知未來結果為何。
    有考慮寫成根據目前法院所協議的「xxx」...只是覺得協議很怪,誰和誰協,怎麼協的?覺得法官還是有說,就先這樣,你們先這樣做,看看會怎樣,所以後來還是寫判...把判改成定如何?或同意呢?

    總之,謝謝來提醒大家這一切還未定案。真開心,有人有看那個和解內容的連結...

    ReplyDelete

Related Posts with Thumbnails