楊建銘專欄:和亞馬遜對幹的CAPER LABS

2019年01月16日 05:50 風傳媒
作者認為,紐約的新創Caper Labs這間成立不到兩年的新創要單挑的不是別的,正是把全世界的實體零售店都嚇得皮皮挫的亞馬遜無人商店Amazon Go。(資料照,AP)

作者認為,紐約的新創Caper Labs這間成立不到兩年的新創要單挑的不是別的,正是把全世界的實體零售店都嚇得皮皮挫的亞馬遜無人商店Amazon Go。(資料照,AP)

在這個亞馬遜看起來所向無敵的時代,任何自稱可以打掛貝佐斯但卻不是其妻的人,大概都會被當成是瘋子。但偏偏我們Hardware Club最近就投資了一家紐約的新創Caper Labs,共同投資人包含知名風險資本公司First Round CapitalPrecursor Ventures。這間成立不到兩年的新創要單挑的不是別的,正是把全世界的實體零售店都嚇得皮皮挫的亞馬遜無人商店Amazon Go。

如大多數讀者所知的,Amazon Go採用相機和雲端機器學習系統,消費者只需要掃描手機上APP的條碼就可以進入商店,拿取完要採購的商品後只要直接走出商店即可,之後會收到消費清單,費用也直接從與亞馬遜帳號連結的信用卡或簽帳卡扣除。

以現行系統來說,目前在全美只有八家分店的Amazon Go解決了消費者排隊結帳的痛點,比起歐美超市已經行之多年的DIY結帳系統更進一步。以我自己曾經造訪過的西雅圖和舊金山的幾間Amazon Go分店來說,可以看到都市上班族川流不息地刷碼進入商店,選購完後怡然自得地走出商店。Amazon Go誕生至今只花短短兩年就成功訓練出一種全新的都會消費者行為,也難怪在加拿大皇家銀行市場分析部(RBC Capital Markets)的一份報告中,他們預測計畫到2021年為止開設三千間分店的Amazon Go,將可以實現一年高達四十五億美元的營業額。

目前市面上可以看到的Amazon Go店面,多半為1200平方呎(約34坪)等級的大小,也就是便利商店的尺寸。加拿大皇家銀行市場分析部的分析報告採用了國家便利商店協會(National Association of Convenience Stores)的資料,以1200平方呎商店來說,他們認為一般便利商店每平方呎的年營收是落在低端的$850左右,換算成一年營收約為一百萬美元,而結帳零時差的Amazon Go每平方呎則可以產生高端的、將近$1300營收,一年最高可以達到一百六七十萬美元營收,以三千家店來說,要產生四十億到五十億美元的營收並不困難。

而就像創立二十四年的亞馬遜線上商店先後打趴實體連鎖書店和電子商城,Amazon Go的快速竄起也攫取了大量的新聞頭條,以至於印象中仰賴傳統(懶惰而昂貴的)勞力的實體超市和超商似乎風雨飄搖,隨時都會被打掛的感覺。

但印象終究是印象,實際上Amazon Go是不是單騎對打傳統超商,必須要回到基本面來看。

舉例來說,以我多次Amazon Go採購的經驗,從走出店門到收到帳單為止,時間差從五分鐘到四十分鐘不等,這裡面其實凸顯了現有Amazon Go的自動結帳系統一個很大的挑戰:以雲端機器學習為根基的自動結帳系統遠遠還沒到理想中的效率。

為什麼這麼說呢?很簡單,如果亞馬遜的雲端機器學習系統已經到達最佳效率,那麼出帳時間的長短不會有這麼大的分佈區間,單純以店裡的人流和消費量高低峰來看,一個已經優化完成的、可信賴的自動結帳系統,似乎要能夠穩定地在一個很短的時間區間內出帳成功,例如十分鐘到十五分鐘之類的。

那麼為什麼Amazon Go現在還會有那麼大的出帳時間差異呢?

要分析箇中原因,我們首先要了解:一個類神經網路的複雜度,在第一階上(to the first order)取決於彼此間關聯性低的輸入變數的數量。以Amazon Go來說,一間店採用了數百台的攝影機,所以最少有數百個彼此大致獨立的影像串流輸入,但不只如此,一間店隨時可能有二十到五十個消費者不等,每個消費者會在不同時間點從不同貨架上取下不同數量的產品,並且在不同時間點改變心意將部分商品放回貨架上(而且還不一定是原本的貨架),中間夾雜著不同時間長度的無行為區間,並在不同時間點決定完成購物走出商店。

這些取樣點和時間點的不定性,代表的是Amazon Go的機器學習系統必須要處理相當高維度而且密度高低變化的輸入變數。亞馬遜自然是沒有公開其類神經網路的設計,但我們可以想像這個系統結合了大量的次網路以及多層的宏觀網路,最後才能順利完成出帳。

「Amazon Go」的顧客不必再大排長龍等結帳,只要拿起商品走出店外,系統會記錄消費內容。(圖截自Amazon Go官網)
「Amazon Go」的顧客不必再大排長龍等結帳,只要拿起商品走出店外,系統會記錄消費內容。(圖截自Amazon Go官網)

因此Amazon Go這個自動結帳系統出帳時間分佈之廣,其實並沒有什麼意外的地方,因為變數的數量不定而且各自夾帶一個時間軸的變異性。從另一個角度來說,Amazon Go也認定消費者並不在乎帳單何時抵達,只在乎自己有沒有被多收錢。儘管一開始遲遲收不到帳單時任何良善公民都會焦慮,但多幾次經驗後也就習慣了,所以等待不是問題。

但是這個優異的使用者經驗反映出來的卻是Amazon Go現行系統一個很大的問題——儘管是由過去三十年來最成功、成長速度最快的科技公司之一所開發,這個系統卻有根本的擴張可行性(scalability)問題。

我們可以用簡單的模型來解釋Amazon Go的擴張可行性挑戰。首先我們假設類神經網路各個輸入變數為互相完全獨立,如果一家店裡有五百種商品,並且隨時固定有二十個客人,單一客人結帳平均為三個商品,那麼這裡面可能的組合數量就是:

20 * C(500,3) = 414,170,000

總共超過四億種可能組合。

如果一家1300平方呎的店總共有兩百隻高清攝影機,每隻高清攝影機無壓縮視訊資料量約為3Gbps,假設客人平均停留十五分鐘,平均每五分鐘拿取一樣商品(數量為一),花十五分鐘取完三種商品,那麼上面這四億種組合的判斷就必須在:

200 * 3Gbps * (15 * 60) = 540,000 Gb = 67.5TB

也就是將近70TB的影像資料上完成分析。

要了解這樣的系統在擴張可行性的困難,我們假設把1300平方呎商店增加10%面積,並假設商品數、平均客戶數和攝影機數量都各增加10%,單客採購數量不變,但停留時間因為商店變大拉長為20分鐘,那麼上面計算出來的兩個數字分別會變成:

22 * C(550,3) = 606,718,200 (增加50%)

        220 * 3Gbps * (20 * 60) = 792,000 Gb = 99TB (增加約50%!)

大家可以看到儘管只是把商店增加10%大小,但不管是必須要做出決定的組合數量,或者是需要判斷出這些組合數量的資料量,都出現暴增50%的現象,這其實並不是什麼魔術,單純就是增加獨立變數必然會對系統造成的指數成長壓力。

當然真正的Amazon Go類神經網路系統不會這麼陽春,一定會採用大量的資料壓縮和網路設計技巧。但儘管如此,底層資料量根本的指數特質是不會改變的,這大概也是為什麼現有的Amazon Go將商店尺寸訂為在零售據點中最小的一種。

而我們甚至還沒談到經營這樣商店需要的成本。事實上一家Amazon Go光是硬體系統成本就超過一百萬美元,因此亞馬遜光是要建置目標的三千間分店就得花上$3B!而如果考慮到目前雲端出帳仍然有驚人的時間差,我們可以想像後端動用到的機器學習資源也是相當驚人,營運成本不可小覷——我們當然也可以想像恩威迪亞負責亞馬遜的業務現在正笑得合不攏嘴。

而上述的這一切技術障礙、建置成本和營運成本,對日進斗金的亞馬遜來說可能都不是問題,但卻對於其他已經被亞馬遜逼到退無可退的實體零售商卻是「不可承受之輕」,這也是為什麼我們雖然談過許多自動結帳系統的新創卻都沒有投資的原因,因為它們大多採用類似亞馬遜的解決方案,雖然實體零售商客戶們大家火燒屁股都恨不得立刻全面自動化,但這類系統建置成本和營運成本都過高,讓一切只能停在紙上談兵。

然後我們遇到了Caper Labs,才談了十分鐘就讓我們猛拍額頭:「對啊!幹嘛像Amazon Go那樣搞得那麼複雜?」

Amazon Go或者類似系統的最大挑戰,是在於開放的環境中,客戶、商品和時間軸的所有變數互相影響,因此呈現指數成長的複雜度。開發這樣的高度複雜系統就跟開發谷歌Alpha Go一樣,是所有機器學習工程師的夢想,但根據不同場景實際上到底有沒有這樣的必要,其實有檢討的空間。

Caper Labs的解決方案就直接反向思考:如果開放空間的各種變數互相影響導致系統過於複雜,與其花一大多腦筋和運算能力去把資料壓縮和降維(dimension reduction),不如一開始就限縮可能的資料變易度和維度。根據這個簡單直覺的想法,以及現有美國超市和超商的使用情境,Caper Labs開發出了以購物車為根基的自動結帳系統。

在Caper Labs的思考中,在超市中購物車是美國消費者幾乎都會使用的工具,一個消費者推一台購物車,因此只要在該購物車上裝置機器視覺系統,追蹤置入和移出該台購物車的商品,就能夠輕鬆判斷該消費者採購的商品。

如果以上面數學運算的例子來看,相較於Amazon Go用一個龐大系統試圖判斷組合超過四億組的「哪個客戶總共拿取了哪三種商品」,Caper Labs的購物車結帳系統移除了客戶的變異數部分,只需解決從五百種商品中擷取三種的、總數為兩千萬種的組合。

尤有甚者,Amazon Go的單一客戶三種商品,可能會在不同地點取下貨架,但又在不同地點放上貨架,而且未必是原本的貨架,追蹤單一客戶的位置和貨架,分析其行為(取和放),都是運算非常沈重的任務。反觀Caper Labs的系統,因為將分析空間限縮在單一購物車內,機器視覺系統只要分析被丟入和移出購物車的商品外觀來判斷出商品種類和數量就可以,不需要考慮到其他的客戶行為的變異性,這也讓這樣的類神經網路遠比Amazon Go的宏觀網路小很多,可以直接在購物車的計算硬體上執行。而在這樣的系統下,客戶推著購物車走出門就可以立刻收到帳單,不會有五分鐘到四十分鐘不等的差異,這部分使用者經驗當然會較Amazon Go好。

當然和Amazon Go的全方位「監視」系統比起來,這樣的系統讓使用者有可能作弊,比方說部分商品不丟入購物車,而是夾在腋下或者放入自己攜帶的購物袋,又或者故意阻擋攝影機鏡頭⋯⋯等。但這些「偷竊」行為在傳統超市本來就存在,零售產業的術語稱為「縮水」(shrinkage)。取決於不同的零售業差異,零售縮水可能介於1%到 3%,對於淨利率長年盤旋在低個位數百分比的零售業來說,的確是一個恨不得除之而後快的痛點。

但是就算不能完全消除縮水現象,和毫無追蹤裝置、只能靠結帳櫃檯肥胖呆滯的時薪人員抓包的傳統商場比起來,Caper Labs的購物車系統因為全時追蹤紀錄各個客戶的消費行為,顯然已經有降低縮水率的功效,如果結合一些低成本的貨架庫存追蹤裝置,未來可能進一步降低縮水的百分比。

亞馬遜無人商店 Amazon GO,天花板裝有攝影機與感應器(取自網路,作者提供)
亞馬遜無人商店 Amazon GO,天花板裝有攝影機與感應器。(取自網路)

而對於所有被亞馬遜逼到牆角的零售商來說更重要的是:這個系統建置成本和Amazon Go比起來少了好幾位數,不用改裝,不用增加寬頻佈線,也不用傷腦筋整合庫存電腦系統和雲端機器視覺系統,只要購入足夠數量的Caper Labs購物車,使用其垂直整合的雲端服務,就可以開店營運!

更重要的是,不同於Amazon Go的系統因為擴張可行性的問題,似乎會被限制在小型店面,Caper Labs的系統可以順利擴張到大型商場以及大賣場。

這一切的種種,都讓Caper Labs的解決方案在零售業者享有很高的接受度,在紐約試營運的兩家超市夥伴截至目前為止都非常滿意,迫不及待要增加導入系統的分店數量,而其他還在等著導入測試系統的零售夥伴早已大排長龍。

本文截稿之時,傳聞貝佐斯已經和即將離異的妻子達成協議,就算分出一半自己持有的亞馬遜公司股票,即將成為全世界最有錢女性的麥肯琦(Mackenzie Bezos)也會讓貝佐斯持續擁有公司主導權——畢竟讓貝佐斯持續掌舵對她自己的荷包也是好事。但是作為Caper Labs的投資人,我們忍不住幻想貝佐斯現在最應該擔心的不是自己長年的伴侶,而是現在窩在布魯克林一間小辦公室的年輕新創⋯。

*作者為台灣大學電機畢業,在台灣、矽谷和巴黎從事IC設計超過十年,包含創業四年。在巴黎工作期間於HEC Paris取得MBA學位,轉進風險投資領域,現為Hardware Club合夥人。

加入Line好友

【我要發風】

風傳媒歡迎各界分享發聲,來稿請寄至 opinion@stormmediagroup.com,並請附上姓名、聯絡方式、自我簡介,謝謝!

楊建銘(Jerry Yang, CFA),現任巴黎風險資本公司Hardware Club管理合夥人。台灣大學電機學碩士、法國HEC Paris MBA,CFA持證人,過去曾在亞洲、矽谷和歐洲半導體業十二年,包含創業四年。(作者的英文部落格:https://medium.com/@jmyang

我想再看到這個主題