歡迎光臨
每天分享高質量文章

線下沙龍 × 報名 | “大規模資料儲存與挖掘”博士生研討會

每年進入11月

周圍的氣氛就變得莫名緊張

各位是不是已經開始全力衝刺

年底的實驗和論文了?

當然是今年的雙十一啦!

戰隊點贊了嘛?

簽到領能量了嘛?

當雙十一撞上年底的實驗和論文

小編忍不住也想給本次活動加把猛料

這裡保證沒有

定金膨脹”、“預約返現”、“尾款滿減”

之類高深莫測的套路

不信往下看

本期計算未來輕沙龍——

 “大規模資料儲存與挖掘”專場 

 嘉賓人數直接翻 3 倍!

點擊閱讀原文免費報名

即可一次性暢享 

九位清華計算機系大神的報告

 張凱 / SmartX 聯合創始人 & CTO 

張凱,畢業於清華大學計算機系高性能所,SmartX 聯合創始人 & CTO。

 儲存技術熱點和趨勢總結 

近年來,儲存技術的發展成為了熱門話題,無論在儲存硬體、儲存協議、還是儲存軟體架構等領域,都出現了新的產品和技術。例如 NVMe SSD,NVM over Fabric,Persistent Memory,Software Defined Storage 等等。此外,也產生了一些新的應用場景,例如虛擬化、容器等等。 

在本次報告中,我們將對近年來學術界和工業界的儲存技術熱點和趨勢進行總結,並介紹軟體定義儲存產品面臨的挑戰。

 李開宇 / 清華大學計算機系博士生 

李開宇,清華大學計算機系,碩轉博四年級在讀博士生,主要研究方向為資料庫下的近似查詢、眾包資料管理和時空資料庫,在國際會議 ACM SIGMOD、國際期刊 IEEE TKDE、國際期刊 CSE,均有一作文章發表。

 眾包資料庫中基於rating-ranking的Top-k查詢 

在這個 talk 中,我將會展示如何在眾包資料庫與中,基於概率模型 rating-ranking 推理給出 n 個物體的 Top-k 查詢結果。並展示如何優化演算法和節約查詢代價。

 李秀星 / 清華大學計算機系博士生 

李秀星,博士在讀,主要研究方向為資料庫上的資料管理,相似度匹配與查詢。碩士期間曾經在國際頂級會議 ICDE 上有論文發表。

 An Efficient Framework for Exact Set Similarity Search Using Tree Structure Indexes 

在這個 talk 里,我將會討論現代資料庫中的一個關鍵技術:相似集合查詢。即給定一個集合,找到資料庫中所有與其相近的記錄。我提出了一種樹狀結構對其進行索引並且應用哈希演算法對其過濾操作進行優化。進一步地,我提出了一種基於資料分塊的多索引結構對查詢過程進行了優化。

 袁海濤 /清華大學計算機系碩士生 

袁海濤,碩士在讀,本科畢業於北京航空航天大學,研究方向為時空大資料管理(包含軌跡大資料的管理與查詢),碩士期間曾在國際頂級會議 ICDE 上發表文章。

 基於路網的出行軌跡大資料相似性查詢與連接 

在這個 talk 中,我們將討論如何在時空資料庫當中,基於路網提高出行軌跡資料在相似性查詢和鏈接的效率。具體來說,我們重新定義了時空資料中基於路網的軌跡表達以及軌跡相似性的計算方式,然後設計相應的索引和查詢演算法。最後,我們將介紹如何在 Spark 上實現相應的分佈式查詢框架。

 孫佶 / 清華大學計算機系博士生 

孫佶,博士在讀,本科畢業於北京郵電大學計算機學院,研究領域為可擴展資料融合。博士期間曾經在頂級會議 VLDB 發表文章。

 分佈式可擴展字串相似查詢系統 

本次報告,我將介紹一個易部署可擴展分佈式字串查詢系統的設計原理以及其在實際資料融合、查詢推薦中的應用。

 駱昱宇 / 清華大學計算機系碩士生 

駱昱宇,碩士在讀,研究領域為資料可視化和資料清洗。曾經在 SIGMOD、ICDE、EDBT 發表文章。

 Towards Automatic Data Visualization 

This talk mainly introduces the key techniques of automatic data visualization. (I) Visualization Recognition: given a visualization, is it “good” or “bad”? (II) Visualization Ranking: given two visualizations, which one is better? (III) Visualization Selection: given a dataset, how to recommend top-k visualizations?

 秦雪迪 / 清華大學計算機系博士生 

秦雪迪,博士在讀,本科畢業於哈爾濱工業大學計算機科學與技術系,主要研究資料庫管理中如何高效的進行資料可視化。博士期間曾經在 EDBT、BIG DATA MINING AND ANALYTICS 發表文章。

 Visualizing Your Data by Keyword Search 

在這個 talk 中,我們會討論如何使用關鍵字搜索來為用戶推薦感興趣的可視化圖。並討論在用戶得到感興趣的可視化圖之後,如何進行進一步的資料探索,來發現更多有意義的信息。

 劉寧 / 清華大學計算機系博士生 

劉寧,清華大學計算機系在讀博士生,研究領域為知識庫管理及資料挖掘技術。

 知識驅動的基於文本的病人死亡預測 

在這個 talk 中,我們將介紹物體知識在醫療文本分類的一些應用,以及如何更好地利用現有的知識庫中的物體提高預測系統的性能。

 冉晨偉 / 清華大學計算機系博士生 

冉晨偉,博士在讀,本科畢業於清華大學計算機系,研究興趣圍繞知識圖譜的擴充與推理。博士期間曾經在頂級會議 WWW、ICDM 發表文章。

 針對微博物體鏈接的註意力因子圖模型 

在這次報告中,我們將關註微博中的物體鏈接問題。我們將介紹如何將因子圖應用於該任務,並通過引入註意力機制,使模型擁有更高的效率。

 

報名時間:即日起至 11 月 8 日 24:00

活動時間:11 月 10 日(本周六)13:30 – 17:30

清華大學信息科學技術大樓(FIT樓)二層多功能報告廳,請從 FIT 樓西門進入

 1 / 報名方式 

長按識別二維碼,馬上搶占名額!

 2 / 活動名額 

1. 因場地有限,本次活動僅接受 120 位 用戶憑電子門票二維碼入場

2. 為了公平起見,我們將在 11 月 6 日至 11 月 8 日期間,每天 13:00 放出 40 個報名名額

3. 活動採取審核制報名,我們將根據用戶研究方向與當期主題的契合度進行篩選,通過審核的用戶將收到包含電子門票二維碼的短信通知;

4. 如您無法按時到場參與活動,請於活動開始前 24 小時在 PaperWeekly 微信公眾號後臺留言告知,留言格式為放棄報名 + 報名電話;無故缺席者,將不再享有後續活動的報名資格。

清華大學計算機科學與技術系

PaperWeekly

中國中文信息學會青年工作委員會

?

現在,在「知乎」也能找到我們了

進入知乎首頁搜索「PaperWeekly」

點擊「關註」訂閱我們的專欄吧

關於PaperWeekly

PaperWeekly 是一個推薦、解讀、討論、報道人工智慧前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號後臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。

▽ 點擊 | 閱讀原文 | 立刻報名

    赞(0)

    分享創造快樂