導讀:趣丸科技成立于 2014 年,是一家集興趣社交及電子競技等業務于一體的創新型科技企業,旗下有 TT 語音、麥可及 TTChat 等多款興趣社交產品。核心產品 TT 語音是國內領先的興趣社交平臺,累計注冊用戶已超 2 億,并成為 LPL、KPL、PEL 等五大頭部電競職業賽事官方合作伙伴。趣丸科技利用多年聚焦興趣社交領域的深厚積累為核心優勢,積極瞄準全球數字技術基礎前沿領域和關鍵核心技術的研發和創新。
構建用戶畫像數據平臺

在 TT 語音數字技術基礎中,用戶畫像和行為分析是技術底座中的核心功能,通過精準的用戶畫像構建和人群圈選持續提升為業務運營能力,帶動業務增長。 整體畫像平臺的業務流程如上圖,通過將多源的數據匯聚到數據平臺,其中數據源包括用戶行為數據、離線標簽、實時標簽和日常運營產生的數據。這些數據通過數據集成服務匯聚到數據平臺后,在數據平臺中構建用戶畫像模型,對外提供人群畫像、人群圈選、用戶洞察、效果分析等數據服務,最終應用于智能運營、AB實驗、客服系統、風控系統和推薦系統等各個上層應用系統中。 由于歷史原因,TT 語音最初的數據平臺構架在 ClickHouse 上,隨著業務的發展 ClickHouse 缺點逐漸顯現出來:
- 由于數據更新性能有限,因此無法滿足實時標簽頻繁更新;
- ClickHouse 內存管理不完善,易出現 OOM 導致服務進程退出的情況;
- 由于不支持事務,DDL 語句無原子性保障;
- 由于 ClickHouse 是存算一體架構,海量數據存儲下每個節點都需要掛載 SSD ,造成存儲成本居高不下,并且擴縮容和運維的成本較高;
- ClickHouse 多表 Join 能力弱,導致大部分業務要在數據集成側打成大寬表后才能分析,增加了業務處理的復雜度。
基于 SelectDB 用戶畫像數據平臺

基于以上痛點,TT 語音將數據平臺進行了升級改造,從 ClickHouse 升級到 SelectDB Cloud。基于 SelectDB Cloud 的新架構也解決了過去存在的諸多痛點:
- 基于主鍵表的部分列實時更新,解決了過去標簽更新不及時的問題;提供輕量化并且原子化的元數據修改,解決標簽的數據準確性問題;
- SelectDB Cloud 通過 MemTracker 機制對內存進行有效管控,可以及時發現和 Kill 異常查詢,保證了穩定的查詢服務、保障線上業務的穩定運行。
- 通過存算分離提供了極致的極致性價比,云上開箱即用的服務,降低了運維成本。
值得一提的是,SelectDB Cloud 既支持大寬表查詢、也支持復雜的多表 Join 查詢,在實際應用中百億明細數據和十多億的標簽數據 Join 僅需要 3-5 秒就能完成,這極大降低了業務的復雜度,提升了業務的靈活性,。 經過一系列的架構探索,TT 語音在服務器資源和成本方面節省了 40%以上,解決了過去存在的數據更新不及時以及數據準確性問題,基于彈性計算、多集群部署以及資源隔離等能力使服務可靠性提升 5-10 倍,整體人群圈選效率提升 10 倍。而 TT 語音也計劃在未來將更多業務放到 SelectDB 中來,包括智能運營、業務風控以及基于用戶行為明細數據的實時人群圈選。最后已經看到大模型與 Apache Doris 在業界已經有很多的成功案例,也會探索大模型結合 SelectDB 構建智能的用戶畫像和洞察服務。


