2020年数据分析面试解答技巧:问答题

发布网友 发布时间:2022-04-20 05:52

我来回答

2个回答

懂视网 时间:2022-04-14 21:42

今天下午参加 参加了杭州某公司的数据分析面试,其中有道题目很熟悉,但没给出最佳答案。 分享一下: 数据结构: 姓名 类别 花费 李 看电影 30 李 吃饭 100 李 旅游 500 王 吃饭 500 王 看电影 100 王 买衣服 700 展现效果: pre name=code class=sql姓名 TO

今天下午参加 参加了杭州某公司的数据分析面试,其中有道题目很熟悉,但没给出最佳答案。

分享一下:

数据结构:

 姓名 类别  花费
 李 看电影  30
 李 吃饭  100
 李 旅游  500
 王 吃饭  500
 王 看电影  100
 王 买衣服  700

展现效果:

姓名 TOP1类别 TOP1花费  TOP2类别 TOP2花费  TOP3类别  TOP3花费
李 旅游  500  吃饭  100  看电影  30
王 买衣服  700  吃饭  500  看电影  100

这题目其实挺简单的,横列转换。效率最高的答案,看最后,。。。。/// 如果有更好的, 欢迎讨论

---------------------------------------------------------------------------------------------------------------------------------------------------------

SELECT NAME,
MAX(DECODE(SEQ, 1, TYPE, NULL)) HIGHEST_TYPE,
MAX(DECODE(SEQ, 1, COST, NULL)) HIGHEST_COST,
MAX(DECODE(SEQ, 2, TYPE, NULL)) SECOND_TYPE,
MAX(DECODE(SEQ, 2, COST, NULL)) SECOND_COST,
MAX(DECODE(SEQ, 3, TYPE, NULL)) THIRD_TYPE,
MAX(DECODE(SEQ, 3, COST, NULL)) THIRD_COST
FROM (SELECT NAME,
COST,
TYPE,
ROW_NUMBER() OVER(PARTITION BY NAME ORDER BY COST DESC NULLS LAST) SEQ
FROM TEST)
GROUP BY NAME;

热心网友 时间:2022-04-14 18:50

【导读】众所周知,随着社会的发展,数据分析师成为了炙手可热的热门执业,一方面是其高薪待遇另一方面就是其未来广阔的发展前景。一般情况下用人单位会给问答题和动手题来检测应聘者的真实实力,可以说面试笔试是非常重要的一个环节。它可以直接测验你对数据分析具体理论的掌握程度和动手操作的能力。为此小编就以此为例和大家说说2020年数据分析面试解答技巧:问答题,希望对大家有所帮助。

问答题

1. 用一种编程语言,实现 1+2+3+4+5+…+100。

这道题考察的就是语言基础,你可以用自己熟悉的语言完成这道题,比如 Python、Java、PHP、C++ 等。这里我用 Python 举例:

sum = 0

for number in range(1,101):

sum = sum + number

print(sum)

2. 如何理解过拟合?

过拟合和欠拟合一样,都是数据挖掘的基本概念。过拟合指的就是数据训练得太好,在实际的测试环境中可能会产生错误,所以适当的剪枝对数据挖掘算法来说也是很重要的。

欠拟合则是指机器学习得不充分,数据样本太少,不足以让机器形成自我认知。

3. 为什么说朴素贝叶斯是“朴素”的?

朴素贝叶斯是一种简单但极为强大的预测建模算法。之所以称为朴素贝叶斯,是因为它假设每个输入变量是的。这是一个强硬的假设,实际情况并不一定,但是这项技术对于绝大部分的复杂问题仍然非常有效。

4. SVM 最重要的思想是什么?

SVM 计算的过程就是帮我们找到超平面的过程,它有个核心的概念叫:分类间隔。SVM
的目标就是找出所有分类间隔中最大的那个值对应的超平面。在数学上,这是一个凸优化问题。同样我们根据数据是否线性可分,把 SVM 分成硬间隔 SVM、软间隔 SVM
和非线性 SVM。

5. K-Means 和 KNN 算法的区别是什么?

首先,这两个算法解决的是数据挖掘中的两类问题。K-Means是聚类算法,KNN是分类算法。其次,这两个算法分别是两种不同的学习方式。K-Means是非监督学习,也就是不需要事先给出分类标签,而KNN是有监督学习,需要我们给出训练数据的分类标识。最后,K值的含义不同。K-Means中的K值代表K类。KNN中的K值代表K个最接近的邻居。

以上就是小编今天给大家整理发送的关于“2020年数据分析面试解答技巧:问答题”的相关内容,希望对大家有所帮助。想了解更多关于数据分析及人工智能就业岗位分析,关注小编持续更新。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
15.4418s