服務(wù)熱線
400-806-2998
近期,谷歌公司在安卓設(shè)備的地圖更新中,增加預(yù)測目的地的停車難易程度。
用戶只需在谷歌地圖中查詢路線,就可以看到一個新的圖標。如果谷歌預(yù)測到你所去的目的地可能有停車灘的風(fēng)險,你就會看到地圖上出現(xiàn)一個彩色的點且附帶字母P。停車的難易程度將分為“車位有限”、“中等”和“容易”三個等級。
谷歌的一篇官方博稱,這一功能目前已經(jīng)向25個美國最大的城市地區(qū)開放。但谷歌公司正尋求在未來將該功能推廣至更多的城市和國家,以及打破平臺限制,延伸至蘋果iPhone設(shè)備上的谷歌地圖應(yīng)用。
谷歌平臺上的另一個地圖應(yīng)用Waze也為美國許多大城市提供類似服務(wù),但谷歌地圖采用的方式略有不同。Waze預(yù)估停車位時采用了INRIX 公司整合的停車數(shù)據(jù)信息,但谷歌聲稱其停車預(yù)測是基于用戶主動共享地理位置歷史,從而獲得的匿名數(shù)據(jù)。
《2月3日,谷歌的軟件工程帥》ames Cook.Yechen Li和研究員Ravi Kumar聯(lián)合發(fā)布了一份研究報告,詳細論述了此項應(yīng)用的原理。要提供這一停車預(yù)測功能,工程師們需要解決許多問題一一停車情況復(fù)雜多變,幾平?jīng)]有實時的停車位信息,即使有些地區(qū)有聯(lián)網(wǎng)的停車計時器,這些數(shù)據(jù)也不包括非法停車、許可停車和提前離開等信息,道路只能提供二維圖像,但停車場本身結(jié)構(gòu)更為復(fù)雜,停車位的供需即時變動,即使是最好的系統(tǒng)都很可能無法及時更新。
為了解決這些問題,谷歌的團隊結(jié)合了眾包和機器學(xué)習(xí)來建立能夠提供停車難度信息的系統(tǒng),甚至還能幫助用戶決策采用何種方式出行。在預(yù)發(fā)布的實險中,他們發(fā)現(xiàn)出行模式技鈕的點擊量大增,這表明用戶獲得了停車難度信息之后,會更傾向于考慮公共出行方式,以取代開車,
要為解決停車難的問題設(shè)計算法,需要三方面技術(shù)據(jù)、一個合適的機器學(xué)習(xí)模型,以及一個用以訓(xùn)練模型的強大特征集。
地面實況教據(jù)
在機器學(xué)習(xí)解決方案中,收集高質(zhì)量的實況數(shù)據(jù)一直是個關(guān)鍵挑戰(zhàn)。谷歌團隊采用的方法
是,問司機是否遇到了停車難的問題。但是,他們很快發(fā)現(xiàn),面對這樣主觀的問題,通常會得到相互矛盾的答案: 對同一時間段的同一地點,有的人回答“容易”找到停車位,有的人的回答卻是“難”。換成“多久能找到停車位?”這樣的客觀問題,答案的可信度就有了很大的提
高,從而能眾包產(chǎn)生高質(zhì)量的、超過10萬個回答的實況數(shù)據(jù)集。
模型特征
有了可用數(shù)據(jù),接下來就是選擇用來訓(xùn)練模型的特征。該項目利用的是喜歡分享定位的用戶提供的匿名聚合信息,以此作為評估實時交通狀況、高流通時間段、訪問時長的關(guān)鍵信息源
谷歌研究員在報告中稱,他們很快便發(fā)現(xiàn),即便有了所需數(shù)據(jù),還是會遇到一些獨特的挑戰(zhàn)。比如,如果有人在自己門前或者私人的停車位停車,系統(tǒng)不該錯誤地認為這里的停車位是可用的。用戶搭乘出租車到達,可能會造成門前停車很多的假象,與此類似,2 共交通用戶可能會被系統(tǒng)認為是在公交車站停車。這些錯誤的認知,都會誤導(dǎo)機器學(xué)習(xí)系統(tǒng)。
因此系統(tǒng)的設(shè)計需要更強大的聚合特征。其中一個功能的靈感就來自谷歌所在的Mountain Vie地區(qū)。加果谷歌導(dǎo)航發(fā)現(xiàn)大量用戶在午餐時間開著車在市中心繞圈,這就表明停車位很難找。
谷歌的研究員在思考,如何把這些關(guān)于停車難的“蛛絲馬跡”作為一個特征來進行訓(xùn)練。研究員把用戶直接到達目的地時間與繞圈、停車、步行這樣實際到達目的地的時間進行了對比,聚合了二者之間的不同。如果多數(shù)用戶在二者之間所用的時間存在顯著差異,就被認為是遇到了停車難的問題。
之后,谷歌團隊繼續(xù)開發(fā)了更多的特征: 特定的目的地、分散的停車地點、停車時間與日期的相關(guān)性(例如,如果用戶來得早會停得離目的地很近,高峰時間來只能停到很遠,該怎么辦?)、歷史停車數(shù)據(jù)等等。最后,他們得到了大約20個不同的特征。之后,就是調(diào)整模型的表現(xiàn)了。
模型選擇和訓(xùn)練
針對上述特征,研究員使用了一個邏輯標準的回歸機器學(xué)習(xí)模型。這種選擇有幾個原因:首先,邏輯回歸的原理是大家所熟知的,并且,在訓(xùn)練數(shù)據(jù)中,它對千擾是有彈性的,第二,可以將這些模型的輸出解釋為停車難的概率,然后可以將其映射成描述性術(shù)語,如“停車位有限”或“輕松停車”,第三很容易理解每個特定特征的影響,這使得驗證模型是否合理更加容易。例加,當研究員開始訓(xùn)練時,許多人認為上述“蛛絲馬跡”特征將是有效的方法,可以解決所遇到的準題。但實際情況并非如此,事實上,基于車位位置分散的特征才是停車難度最強大的預(yù)測因素之一。
結(jié)論
使用谷歌的極型研究員們能夠為任何位置和時間的停車灘度生成一個估算值。下圖是該系統(tǒng)輸出的幾個創(chuàng)千用于提供給定目的地的停車難度估計。比如,星期一早上對整個城市來說博車部國準尤其是最繁忙的全融和年售區(qū)。在星期六晚上,又會再次變得繁忙,但卻主要集中在餐廳和景點等區(qū)域。