歡迎光臨
每天分享高質量文章

3位高二女生用大資料成功預測地鐵出站人數 | 00後正在拋棄你

導讀:有人用大資料“殺熟”,她們卻用大資料做了軌道交通客流分析,運用自己設計的演演算法,對軌道交通出站人數的預測平均精準率達到了93%。4月15日,在第33屆重慶市青少年科技創新大賽上,南開中學三位高二女生的研究專案獲得了一等獎。

01 擠地鐵,擠出來這個課題


譚婧懿、韋沐汐、唐睿詩是南開中學高二年級的學生,雖然三人不在同一班上,但她們都有一個共同的愛好,參加科技創新活動。說起這次參加重慶市科技創新大賽,譚婧懿有些不好意思,“這個選題,還是我們上學放學擠地鐵擠出來的。”


原來,三位女生經常坐1號線。


“每天早上上學和放學回家乘坐軌道交通會這麼擁擠?根本就擠不進去啊!”“如果有方法能夠迅速疏散客流,為市民提供快捷、舒適的出行服務,那該多好!”


三個人你一言,我一語,就把選題給定了下來。



02 找資料,一站就是3小時


確定了選題,就開始找資料。“她們用了最笨但也是最實在的辦法,就是高峰、平峰兩個時間段,到地鐵站數人。”指導老師楊夢寧說。


“我們三個人,一人數出站人數,一人數進站人數,一人看車廂的擁擠程度。”唐睿詩說,雖然大家有分工,但一天數下來,“是真累,好想帶個小板凳坐下,好想吃個麵包充饑。那段時間真是太累了,回去就不想動,放空自己。”放學後、假期裡,在地鐵1號線的沙坪壩站,三位小女生成了常客。還因為長時間站在那裡,不少人以為她們是志願者,“好多來問路的。”


付出總是有回報,數了一段日子後,孩子們在自己整理的記錄上,發現了一些規律,“我們透過這些數字中的規律,再找到負責部門要了一些資料,做後期的研究。”



03 做分析,手算一個月才處理兩個星期資料


拿到了海量資料,就要做分析找規律。因為之前沒有做過類似的課題,三位女生又用到了最原始的方法,把資料錄入到Excel裡“手算”。“因為資料要錄入,還要排版,這樣‘手算’了一個月,才處理兩個星期的資料,這樣不是辦法。”楊夢寧說。


於是孩子們運用多種演演算法對資料進行計算,“最開始,預測精準率只有60%,後來加入其他演演算法,提升到70%以上。但她們拿著這樣的結果給運營部門看時,他們說精準率在80%以上,才算有點意義。”在加入深度學習演演算法後,“我們再把空間特徵轉化為時間特性來進行計算,平均精準率就達到了93%。”譚婧懿說。


“我們的創新主要是將軌道交通的空間資訊引入到客流預測中,同時引入了兩種不同的時間資訊,即歷史同期序列與順序時間序列,並將其結合,形成新的特徵組。除此之外,還將時空特徵進行結合引入到客流預測中,將空間特徵以及時間特徵歷史共同結合來建立模型,能更準確全面地進行客流預測。”三個女生的這一專案不僅獲得了一等獎,目前也正在申請相關的專利。

來源:重慶晨報
記者:羅薛梅

推薦閱讀

日本老爺爺堅持17年用Excel作畫,我可能用了假的Excel···

看完此文再不懂區塊鏈算我輸:手把手教你用Python從零開始建立區塊鏈

為什麼要學數學?因為這是一場戰略性的投資

180頁PPT,講解人工智慧技術與產業發展

Q: 你高中時都幹了些啥?

歡迎留言與大家分享

覺得不錯,請把這篇文章分享給你的朋友

轉載 / 投稿請聯絡:baiyu@hzbook.com

更多精彩文章,請在公眾號後臺點選“歷史文章”檢視

贊(0)

分享創造快樂