字节跳动面试总结

2022-08-11
浏览 (583)

字节跳动面试总结

前言

前阵子字节跳动的提前批开始了，看宣传是说有海量HC，机会多多，本着涨涨面经的心理，然后就投递了一下杭州那边的Data部门，首先在这里还要非常感谢内推我的小哥哥，非常热心的帮我跟踪进度，因为中间还出了一些小插曲（我投错部门了。。。），还是热心的小哥哥帮我联系HR，最后把我转到想要投递的部门了~

第一面

第一面我觉得应该是基础面，重点考察的是自己技术的广度和一些技术的掌握情况，一面小哥哥也没有深究于某个特定的点，面试时间大约1个小时。

自我介绍
怎么打算投递后台岗位的，没有考虑契合自己研究方向的工作
有了解过OAuth2.0么，说说你对OAuth2.0的理解
蘑菇博客开发过程中，有了解或学习其它的开源框架么
蘑菇博客文章发布的流程是怎么样的，是多人博客系统么
对其它的一些博客框架有了解么，比如hexo
hexo和蘑菇博客相比有什么区别呢？蘑菇博客多了哪些功能和优势
看你蘑菇博客用到了RabbitMQ，那谈谈为什么引入RabbitMQ？
RabbitMQ和其它消息队列，比如ActiveMQ，RocketMQ，Kafka有什么区别
Redis在你博客项目中的使用，为什么引入Redis？
Redis中存储的是热门文章，是通过什么来得到的？这样做会有什么问题么？
有听过长尾效应么？你通过推荐字段设置的推荐等级，这样会让这些文章一直保持在较高的点击量，而且热度和点击量也不会随着时间而降低，有什么解决方案么？
我看到你有用到JustAuth这个登录授权？说说它会存在账号泄漏的问题么？
下面谈谈Redis，它会存在线程切换的问题么？
谈谈Redis单线程模型和IO多路复用
Redis的大Key的问题，如果有个Value的大小是2M，会有什么问题么？最大支持的Value大小是多少？
谈谈Redis集群 Redis Cluster，以及主从复制原理？
说说Redis中的哨兵，即Redis Sentinel
下面来聊聊Linux，你知道Linux怎么查看当前的负载情况么？
你还知道其它的一些Linux命令么？
cat、tail、vi、vim命令的区别，分别说一说？
如果Linux下需要打开或者查看大文件，你会怎么做？
下面聊聊Http Code，你知道 3XX 状态码对应的是什么？
在谈谈你知道的其它一些状态码，4XX 和 5XX？
下面我们来做个题目吧？语言任意，选择喜欢的（ps：其实是leetCode原题，没有做过类似的，想了几分钟没有思路，哭。。，想问问思路，然后说换一题吧，那就，事后想想还挺简单的，根据第一位排序一下就好了）

# 给定一些数组，例如下面的格式，他们都表示一个区间，然后你需要将区间进行合并
[1,2],[2,4],[3,7],[8,11]
# 如上所示， [1,2] 和 [2,4] = [1,4]
# 然后 [1,4] 和 [3,7] = [1,7]
# 最后 [1,7] 和 [8,11] 无法合并，所以最后结果应该返回 [1,7],[8,11]

那就换个题目吧，看看下面这个题目，找数组出现次数最多的TOP N，回头听室友说，好像又是leetcode原题，泪目，算法能力太弱，没怎么刷题。

# 给定一个数组，例如 [1,1,2,2,2,3,3,3,3]这样的，里面的数组不一定连续并且有序，假设我输入 2，这个2表示出现次数最高的两个
# 那么你需要给我返回 2,3

然后我最开始的思路就是，通过hash存储出现的次数，然后key就是数组中出现的值。最后在对hash中的次数进行排序，最后得到top N，因为时间复杂度是O(N^2)，问有没有优化思路，能否优化到O(N)，想了半天没有想出来，没有充分运用已经构建好的hash表

后面面试官给讲了一下思路。最后我们一次遍历，已经得到这样一个hash表

# key：数组中的值，value：出现的次数
map = {
 1: 2
 2: 3
 3: 4
}
# 因为说过出现的次数是不会有相同的，所以可以翻转hash，也就是把原来的key作为value，value作为key
tmpMap = {
  2: 1,
  3: 2,
  4: 3
}
# 然后因为数组的出现次数最多是  len(array)，也就是数组的长度，那么我们只需要从长度最高的去遍历，然后从hash中取，如果能取到，表明就是最多的
count = 0
ret = []
for i in range(len(array), 0, -1):
    if tmpMap.get(i):
        ret.append(tmpMap.get(i))
        count += 1
        if count > 2:
            return ret

反问环节，问了问面试的表现，被告知算法能力比较薄弱，以为就此凉凉。。。然后一面说这边可以让你进入下一环节，这边大概需要等5到10分钟左右

第二面

二面考察的是技术深度面试，面试时间大约50分钟左右

自我介绍
博客已经开源了么，用的什么开源协议，博客的用户多么？
看你博客中用到了Solr和ElasticSearch，谈谈它们的原理，以及倒排索引？
对于Solr或者ES里面用到的一些中文分词器有了解过么？
谈谈那些技术栈，你比较熟悉的是那些，mysql 和redis？
聊聊MySQL的底层索引结构，InnoDB里面的B+Tree？
B Tree 和 B+ Tree的区别
聊聊MySQL索引的发展过程？是一来就是B+Tree的么？从没有索引、hash、二叉排序树、AVL树、B树、B+树聊。
谈谈MySQL里面的事务，说说什么是事务？
MySQL里面有那些事务级别，并且不同的事务级别会出现什么问题？
谈谈可重复读和幻读的区别？
MySQL中如果使用like进行模糊匹配的时候，是否会使用索引？一定不会用么？（索引这块了解的太少了，二面结束后，回去恶补了一下）
谈谈Redis吧，在你项目中的具体使用？
谈谈Redis如何实现分布式锁？
蘑菇博客是否存在缓存不一致的情况，你是如何解决的？
谈谈Redis中缓存穿透的问题，以及解决的方法？
还有其它解决缓存穿透的方法么？布隆过滤器有了解过么？
Redis中大面积的缓存失效，然后请求全部打到数据库，有什么解决方法？
如果出现一些热点数据，比如明星之间的新闻，造成大量的吃瓜用户涌入后台，但是服务器还没有缓存对应的数据，这样可能造成数据库宕机，如何避免这样的情况？
聊聊 JVM的组成结构？
谈谈垃圾收集原理？以及垃圾收集算法
复制算法和标记整理算法？
为什么不在新生代使用标记整理算法？或者在老年代使用复制算法？
有了解过Volatile么？谈谈你对Volatile的理解
Volatile如何保证可见性的？以及如何实现可见性的机制。
如果大量的使用Volatile存在什么问题？
谈谈操作系统的线程，以及它的状态
线程和进程的区别？
为什么要提出多线程应用，而不是多进程应用呢？
Linux你平时都有用到什么命令呢？
如果我需要查看端口号或者进程号，你会使用什么命令？
谈谈你做的另外一个项目吧？稍微介绍一下
来吧，写个题目试试

# 链表的两两翻转
# 给定链表:  1->2->3->4->5->6->7
# 返回结果：  2->1->4->3->6->5->7

毕业时间是什么时候？现在面试的是实习岗位么？
反问环节：追问面试表现？告知 Redis这块掌握的还可以，但是MySQL这块显得不足。问后续的安排。

第三面

应该是Leader面，面试时间大概50分钟

自我介绍
好奇一下，用码云的人应该不多吧，为什么没有用Github？
你英文水平怎么样？
聊聊开源项目吧？我看这项目已经有800多赞了，你在这开源项目主要做了什么工作？
我们找些点来聊聊吧？先从ES和Solr开始，你们这两个都有在用么？
SQL的方式实现搜索，你是怎么做的呢？
使用like匹配的时候，会不会查询非常慢呢？
ES和Solr的底层都用了lunce，谈谈你对lunce的理解？
lunce里面也有用到分词器，比如一些新的词 “新冠肺炎” ，它能不能做到很好的划分呢？
除了人为的维护词库，来解决最新词语的分割，你还有知道其它什么更好的方法么？
你有了解过其它什么开源的分词库么？
谈谈字典树？
Solr 和 ES底层都用了Lunce，那他们两者有什么区别呢？
Solr所谓的集群环境和 ES所谓的分布式环境，它们之间有什么区别呢？
上面你有提到微服务，你有了解过微服务是个什么样的理念么？
你现在的微服务，也是打包成多个jar包，部署在一个服务器上，如果服务器出现问题了，也会造成服务不可用，有没有好的解决方法呢？
聊聊服务的注册与发现？
服务的注册和发现，其实依赖于一个注册中心的概念，会不会出现注册中心挂掉，而导致整个服务不可用，有没有什么好的解决方法呢？
有了解过Zookeeper整个的选举过程么？
谈谈Zookeeper的分布式一致性协议？
聊聊索引，我给你写个表，看看下面的查询语句，走了那些索引？

create table 'tb' (
   id int,
   name varchar(64),
   status int, 
   createtime timestamp,
   PRIMARY KEY (`id`)
)

-- 创建了三个普通索引
create index  index_name on table('name')
create index  index_status on table('status')
create index  index_createtime on table('createtime')

-- 给定SQL语句，判断下面查询会用到几个索引
select * from  tb where status = 1 and name = "zhangsan"

上述SQL用到了几个索引？分别是那几个？
有了解过InnoDB底层的索引结构么？
通过两个索引查询出来的结果，会进行什么要的操作？交集，并集？
如果你在MySQL中遇到一些慢查询，有什么解决方法么？
谈谈explain？执行的explain后，出现的那些字段，能够帮助我们呢？
我看你的博客里面，关于Redis还有好几篇文章，我们可以聊一聊你对Redis的理解？
为什么Redis能够保持这么高的并发响应？
有了解过IO多路复用技术是个什么样的原理
通过一个线程，同时连接多个线程不会存在多个线程切换么？（感觉进坑了。。）
当你通过jedis进行连接redis的时候，已经和一个进程连接了，redis还能够和其它的进程进行通信么？
Redis每秒能够处理处理十万请求，如果按照你上面说的，那说明它每次交互只在 1/十万秒内完成？
有了解过Redis的源码么？
MySQL用了B+Tree，Redis中的SortSet内部用了跳跃表，他们之间有什么差别？为什么MySQL不用跳跃表，或者是Redis不用B+Tree呢？
感觉自己编码功底怎么样？那我们先聊聊操作系统的知识在给你一道题吧。在操作系统中，有高速缓存，主存，虚拟内存，外存，有知道它们之间有什么样的关系，以及它们的作用是啥？
对它们来说，肯定会存在一个问题，就是当我们的主存满了，或者虚存满了，那么需要存在一个换页操作，你知道有那些换页算法么？
我们来聊聊LRU？叫你手写一个LRU算法谈谈你的思路？
用链表的方式实现，时间复杂度是O(N)，有没有什么方式能够让它是O(1)的时间复杂度呢？
OK，思路还可以，那你手写一个LRU算法吧？（双向链表 + Hash？）
反问环节：问了下组织架构，已经python和go在项目中的使用。然后问了下面试的表现，得：代码写的不算好吧，LRU写成这样我觉得是不太合适的。（心碎的声音，感觉到凉凉的气息…），结束后以为面试已经结束，后面在准备关页面的时候，面试官说等一下，还有同学和我聊？

HR面

花10来分钟做个简单的沟通

自我介绍
考研的时候为什么选择的是这个学校呢？
回顾一下，上大学到现在这段时间内，让自己最有挫败感的事情是什么呢？
有那些方面需要在改进的么？
回顾一下，上大学到现在这段时间内，让自己最有成就感的是什么事情呢？
对毕业工作的地点是有什么想法？
校招也陆陆续续开始了，在面试流程中的公司还有那些么？
对于以后参加的工作，你主要会看重那些方面呢？
毕业时间？
同学这块，大家都有在投递字节这边的岗位么？
反问环节：关于面试结果，告知，这边只是做简单的了解，面试结果大约会在一周左右出来，到时候会有邮件或者电话通知。关于面试的结果，需要综合前面的几个面试官进行综合评测，才能决定是否录取。