2014新浪微博事业部推荐算法岗位笔试题
1.选取一个你掌握最好的推荐算法,然后详细描述下掌握的细节,比如算法的实现、优缺点、适用场景等等。(10分)
2.机器学习算法都包含哪些部分,即机器学习算法/模型的训练和在线环节,我们都需要做哪些事情?在这个过程中,需要注意哪些问题,以及需要利用哪些技术以保证训练模型的效果,比如怎样解决过拟合和欠拟合问题?(10分)
3.趣味性题目:猜帽子游戏(10分)
A、B、C3个人围坐成一个圆圈,在主持人的带领下进行一次团队合作的游戏。主持人给每个人戴一顶黑色或白色的帽子,每个人都只能看到另外两个人头上的帽子颜色。现在,他们需要独立地猜测自己头上的帽子颜色。每个人都要在自己手中的小纸条上写下“黑色”或者“白色”或者“放弃”,然后交给主持人。如果说至少一个人猜对并且没有人猜错(即写“放弃”),那他们就获胜了;如果有任何一个人猜错或者一个人猜对并且没有人写放弃,那么他们就输了。如果在游戏开始前他们能商量一个策略,那么最好的策略是?这种策略下,获胜的`概率是多少?那如果有N个人参与游戏呢,最好策略下的获胜概率是多少?
4.有若干个整数变量,请分析,如果用数组、vector、链表、队列4种数据结构存储,请对它们占用的内存情况排序,并说明其在系统中的内存分配情况(连续还是离散的?)此外这4种数据结构都有哪些优缺点,适用范围是什么样的?(5分)
5.如何判断一个队列不是循环队列?(5分)
编程能力考查
1.请编写程序,从包含大量单词的的文本中删除出现次数最少的单词。如果有多个单词都出现最少的次数,则将这些单词都删除。(20分)
输入:文本文件,多行;每行包含多个单词,每个单词间以“\t”键分割。
输出:文本文件,格式和输入文件保持一致,只是把整个文本中出现次数最少的单词抹掉。
2.gcc与g++进行程序编译时有什么区别(生成的函数名在obj文件中有什么差异)?二者混合编译时,需要在头文件中添加哪些内容,才能保证编译顺利通过?(5分)
3.#include
4.写一个通用函数,输入为一个字符串,输出为判断该字符串是否为4位ip地址,比如255.16.231.117 (15分)
5.一个如下格式的文件,
uid[int] value[string]
一共有5亿条记录,同时文件大小500G。
请在一台内存为64G的服务器上提供线上服务,让访问者查询uid中的value值(15分)
【2014新浪微博事业部推荐算法岗位笔试题】相关文章:
新浪微博认证技巧11-15
新浪微博认证条件11-13
新浪微博个人认证步骤11-15
如何申请新浪微博认证11-09
新浪微博认证怎么弄08-29
新浪微博认证需要哪些条件08-29
2017新浪微博认证申请攻略08-20
新浪微博自媒体认证10-27
新浪微博自媒体怎么申请10-01
新浪微博推广实用技巧08-17