新浪2014校园招聘推荐算法笔试题

发布时间:2014-04-12 编辑:思莹 手机版

  1.选取一个你掌握最好的推荐算法,然后详细描述下掌握的细节,比如算法的实现、优缺点、适用场景等等(10分)

  2.机器学习算法都包含哪些部分,即机器学习算法/模型的训练和在线环节,我们都需要做哪些事情?在这个过程中,需要注意哪些问题,以及需要利用哪些技术以保证训练模型的效果,比如怎样解决过拟合和欠拟合问题?(10分)

  3.趣味性题目:猜帽子游戏(10分)

  A、B、C3个人围坐成一个圆圈,在主持人的带领下进行一次团队合作的游戏。主持人给每个人戴一顶黑色或白色的帽子,每个人都只能看到另外两个人头上的帽子颜色。现在,他们需要独立地猜测自己头上的帽子颜色。每个人都要在自己手中的小纸条上写下“黑色”或者“白色”或者“放弃”,然后交给主持人。如果说至少一个人猜对并且没有人猜错(即写“放弃”),那他们就获胜了;如果有任何一个人猜错或者所有人都写放弃,那么他们就输了。如果在游戏开始前他们能商量一个策略,那么最好的策略是什么?这种策略下,获胜的概率是多少?那如果有N个人参与游戏呢,最好策略下的获胜概率是多少?

  4.有若干个整数变量,请分析,如果用数组、vector、链表、队列4种数据结构存储,请对它们占用的内存情况排序,并说明其在系统中的内存分配情况(连续还是离散的?),此外这4种数据结构都有那些优缺点,适用范围是什么样的?(5分)

  5.如何判断一个队列不是循环队列?(5分)

  编程能力考查

  1.请编写程序,从包含大量单词的文本中删除出现次数最少的单词。如果有多个单词多出现最少的次数,则将这些单词都删除。(20分)

  输入:文本文件,多行;每行包含多个单词,每个单词间以“\t”键分割。

  输出:文本文件,格式和输入文件保持一致,只是把整个文本中出现次数最少的单词抹掉。

  2.gcc与g++进行程序编译时有什么区别(生成的函数名在obj文件中有什么差异)?二者混合编译时,需要在头文件中添加哪些内容,才能保证编译顺利通过?(5分)

  3.#include和#include“filename.h”有什么区别?(5分)

  4.写一个通用函数,输入为一个字符串,输出为判断该字符串是否为4位ip地址,比如255.16.231.117(15分)

  5.一个如下格式的文件,

  uid[int]         value[string]

  一共有5亿条记录,同时文件大小500G

  请在一台内存为64G的服务器上提供线上服务,让访问者查询uid中的value值(15分)

下页更精彩:1 2 3 4 5 下一页
本文已影响
新浪2014校园招聘推荐算法笔试题相关推荐