2018年有不少大數據學員學成準備參加工作,在參加工作前最重要的一輪就是大數據的面試,優就業小編收集了一些2018常見的大數據面試題,希望可以幫到準備或者正在參加大數據面試的朋友們。
1、除了K-means,你還知道哪些聚類算法?
2、K-means中的類別數N如何確定
3、Web或移動端的時代,我們有哪些數據采集的方法?
4、說一下JVM內存模型,GC算法,GC垃圾回收機制,如何優化?
5、Hbase的操作是用的什么API還是什么工具?
6、重跑數據的時候數據冪等是怎么做的
7、在2.5億個整數中找出不重復的整數,注,內存不足以容納這2.5億個整數微博有11億的用戶,其中大約50萬是藍V用戶,用戶用uid標示,試設計一套架構,判斷一個用戶是否是藍V,畫出架構圖,并給出關鍵算法。要求消耗的內存最小,效率最高,同時能夠適應藍V用戶的動態增減。
8、有一個1G大小的一個文件,里面每一行是一個詞,詞的大小不超過16字節,內存限制大小是1M。返回頻數最高的100個詞。
9、N個為排序的整數,在線性時間內,求這N個數在數軸上相鄰兩個數之間的最大差值(寫出關鍵算法)
10、給定a、b兩個文件,各存放50億個url,每個url各占64字節,內存限制是4G,讓你找出a、b文件共同的url?
相關推薦:
更多內容
>>本文地址:http://www.028benet.com/jiuye/2018/45447.html
聲明:本站稿件版權均屬中公教育優就業所有,未經許可不得擅自轉載。
1 您的年齡
2 您的學歷
3 您更想做哪個方向的工作?