Python初学者的自我修养,找到自己的方向

语言: CN / TW / HK

,关注并星标,

今天是 Python专题 的第22篇文章,原本今天是准备和大家继续Python当中多线程的使用的相关内容。然而前两天有一个读者在后台问我,学习Python有哪些适合新手入门的小项目推荐,所以今天这篇临时改为了答疑篇,咱们来聊聊这个问题。

对于我来说Python的应用场景主要是机器学习、深度学习相关,对于其他的场景涉猎不多。因此本文的目的并 不是列举出一系列小项目给你们练手,而是希望引导大家思考这个问题 ,从而找到适合自己的练习项目。

Python的误区

不知道各位初学者如何看待Python这一门语言,又是如何看待程序员的技能,根据我的理解, 这当中可能存在一些误解。其实 不论哪一门语言的应用场景可能都不只是一个方向,往往是多个方向 ,尤其是Python这种比较成熟并且广受欢迎的语言,它在许多领域都有很高的建树,这就导致了Python可以做的事情非常多,相应的要学习的东西也就非常多。

也许在新手看来一个比较厉害的Python使用者(比如我),应该是所有技术通杀的,对于Python的方方面面都非常了解。然而很遗憾, 这是非常困难或者说几乎是不可能的 。困难的原因也是很简单的,因为人的精力是有限的,想要在一个领域做到优秀就已经非常不容易,需要学习大量技术和知识了,更何况掌握所有方向。所以大家对于这样一个问题,应该有一个清晰的答案,对于Python这样一门语言,你们学习它的目的究竟是什么?

也许你有很多个答案,但是很遗憾, 对于你未来职业发展来说,你可能只能选择其中一个

方向选择

如果你玩过暗黑破坏神、魔兽世界或者是类似的RPG游戏的话,那么你对于选择职业这个问题应该非常了解。在我们刚进入游戏或者是进入游戏不久,我们就需要面临一次职业选择,职业一旦选择往往不可更改,你就需要在这个职业一直玩下去,如果想要换职业只有从头开始,重新玩一个新的号。

在职场当中和游戏是非常类似的,我们最终也需要选择我们的职业,并且我们 只能选择一个岗位 ,轻易也是不能更改的。如果要更改,需要从头开始,之前累积的经验会全部清零。因为不同岗位对于能力的要求是完全不同的,所以对于初学者而言,其实也会面临这么一个选择,只不过这个选择是隐形的,当你选择岗位进行投递简历的时候,这个选择就潜移默化的发生了。

Python常用的基础语法并不多,在我们之前的文章当中几乎涵盖了大半。 当我们完成了这部分学习之后,单单学习语法已经没有出路了。 再接下来进阶就必须要学习一些应用上的内容,也就是要面临一个技术选型了。

对于Python而言,一般常见的方向有这么几种: web开发、机器学习、网络爬虫、运维、游戏开发

下面我简单介绍一下这几个方向,大家可以对照一下自己的兴趣,选择一个自己感兴趣或者是比较适合的。

web开发

Web开发应该是当下最普遍的程序员的工作岗位了,Python在web上的应用主要是 web的后端开发 ,也就是负责服务器逻辑处理这个部分。

我们都知道在后端这个领域目前国内最吃香的语言应该是Java,几乎大半的公司都是使用Java作为后端语言。 Java之后的其他几门语言我也难分伯仲,简单列举一下有新兴的Go,有古老的PHP,当然还有Python,还有已经几乎绝迹的C++和C#。 Python在这个领域当中应该只能算是不算特别小众, 总体来说还是偏小众的

小众的原因和Python本身的特性有关,因为Python是解释型语言,而不是编译型语言。 所以和Java、Go这种编译型语言相比,在性能上天然就要劣势。 并且由于Python全局锁的限制,导致了Python多线程在计算密集型的并发场景当中表现非常糟糕,所以很少有大公司会使用Python作为后端主力语言。 据我了解国内知名一些的应该只有豆瓣、知乎,国外的有YouTube,但据说有些已经迁移到其他语言了,有的已经有相应的迁移计划了。

Python在后端的 主要优势在于敏捷 ,也就是开发效率比较高。 Python的Django、Falsk等框架还是非常完善以及好用的,我们可以很快地从零开始搭建出一个像样的后端来,并且 迭代的速度也很快 所以对于一些需要小步快跑对于性能要求不高的小公司,可能会选择Python,也就是大公司几乎不会选择Python作为Web后端的开发语言,技术栈也必然完全不同。

如果你需要选择这个方向,那么你除了要学习Python后端开发的相关知识,比如Django、Flask等框架之外, 对于计算机网络以及前端也需要一定的了解 ,这些也是后端工程师的必修课。

总体来说,Python后端这个发展方向相对比较平坦,后期发力的难度比较大,天花板比较低。 学习难度和Java后端相比可能要稍微简单一些,就业压力应该也还好,相关的岗位虽然不太多但也不会太少。

如果要选择这个领域的话,可以 选择一些比较常规的项目作为入门的项目 比如搭建一个个人博客,或者是XX管理系统,等这些熟练了之后就可以学习更多其他的工具库了,比如数据库ORM框架、kafka、redis等这些常用的中间件。 把这些内容再结合到web当中,创建出新的项目。 等这一块也差不多了,接下来就可以研究研究架构设计、设计模式等等进阶的内容了。

机器学习

这个领域我相对比较了解一些,对于机器学习来说, Python目前是妥妥的主力语言 早年还能看到一些使用R来做机器学习的工程师,目前已经几乎看不到了,几乎是清一色的Python。 但是老实说机器学习当中Python只是起到胶水语言的作用,几乎所有核心的实现逻辑都不是Python支撑的。

在机器学习当中对于Python原生的内容要求非常普通, 只需要会基本的语法,了解迭代器、生成器几乎就足够了 因为大部分内容都是通过框架或者是工具来实现的,Python只是把这些逻辑粘合到一起而已。 这个方向的从业者的技能点在Python上的非常少,大部分都在机器学习的相关理论、一些库工具的使用、深度学习框架的使用、数据处理方面的经验。

并且机器学习本身就是一个比较大的领域,它也有很多方面的应用。比如 搜索、广告、推荐 这些传统的应用场景,以及 CV(计算机视觉)、NLP(自然语言处理)、风控 等等比较新一些的领域。所以选择了机器学习这个大方向,并且完成了基础知识的学习之后,还是要再面临一次选择的,因为还需要选择进一步细分的小方向。根据我个人的经验来说它们的发展前景是 推荐、搜索、广告 > NLP > CV > 风控 ,这只是我个人的判断,仅供大家参考。

机器学习这个方向整体来说前景是非常不错的,目前几乎大中小型的公司都有机器学习或者是深度学习的岗位。虽然岗位多,但是 竞争并不低 ,因为想要涌进来的人实在是太多了。尤其是这两年AI火热,大量的人想要挤进这个行业中来,所以招聘门槛还是不低的。

如果你想要选择这个方向的话,只需要基本的Python语法即可,但是 需要对机器学习这个领域有着比较深入的学习 。比如机器学习的核心概念、常用的一些模型、数据处理的一些方法、模型效果的评估标准等等。等对机器学习的理解足够了,就可以找kaggle、天池大数据等一些比赛来实战一下。

爬虫

爬虫这个方向大家也不陌生,很多人应该看过一些相关的负面新闻,比如窃取用户隐私或者是窃取了某某公司的数据等等。实际上爬虫的 本质是利用程序模拟人工对网页进行访问,从而将网页当中相关有价值的信息存储下来

Python由于语法简单,并且网络相关的工具库非常完善,而且不需要经过编译就可以直接运行。更重要的一点是 Python的全局锁在网络请求这种IO密集型的场景当中非常合适 ,并不会影响效率。而且Python可以很方便的整合其他语言的功能以及特性,使得Python做爬虫非常合适,以至于市面上大部分的爬虫工程师都是以Python为语言开发的。并且现在也衍生了许多分布式爬虫的框架和工具。

由于大家都使用爬虫,而一些大公司不愿意自己的相关信息被竞争对手获取了去。举个例子,假设某东把淘宝所有的商品信息都爬取了下来,然后针对性的降价来强行吸引用户,那么显然对于淘宝是一个打击。为了防止类似以及其他不利于公司的情况出现,这些 大公司都会设置一些反爬虫的机制 。比如在请求来临时会判断是否是机器人,或者是会限制一个ip最多访问的商品数量等等。

既然有反爬机制,那么自然也有破除反爬机制的机制。所以公司里真正爬虫工程师往往的日常工作就是 和一些大公司的反爬工程师斗智斗勇 。你设置了这个反爬机制,我就想一个办法来破除。明天你发现了我的方法做了修补,我再继续想办法……并且在编写爬虫之前, 需要做大量网页的分析,找到网页或者是应用中数据的源头api 。有些公司会把api隐藏起来,或者是需要一定的校验才能访问,那么就需要设置一些方法针对性的破除之后才能使用爬虫。

有些人不喜欢这种斗智斗勇很多,开发时间很少的工作,而有些人就乐此不疲,大家可以对照一下自身的情况做一个选择。如果想要选择这个方向的话,可以 从一些公开的没有设置反爬机制的数据开始 ,学习一些目前比较先进的爬虫框架,之后再一步步提升难度,去试着破除大公司的反爬机制,成为一个优秀的爬虫工程师。

运维和游戏开发

老实讲这两个领域我的了解实在是不多,所以硬着头皮简单说说,水平有限,如果有错误还请大家海涵。

运维在我们都知道就是 负责维护机房机器环境、项目发布上线等工作 的,由于现在公司用到的机器的数量越来越多,整个发布以及维护的流程也就越来越麻烦。之前极其少的时候还可以人工一台一台搞定,现在机器多了还使用人工来干显然就不现实了。为了解决这个问题,所以现在先进的运维会使用Python编写脚本,来 批量操作机器安装环境或者是发布项目 等等。

说白了其实也是把Python当成是脚本语言这样的工具来使用,核心的能力其实还是偏在 Linux命令、操作系统、分布式集群 这一个部分。对于运维这个领域,我个人感觉和机器学习差不多,Python只是纯工具,大家想要入门项目的话,可能还是要以运维相关的技能为主,使用Python来作为工具辅助。

游戏开发我稍稍了解一点,之前用Python做过一些简单的小游戏。Python当中的pygame非常好用, 编写小游戏非常合适 。并且Python也可以接入Unity,github里能搜到不少使用Python做出来的游戏。但是有没有游戏公司招聘Python程序员来进行游戏开发我就不清楚了,毕竟不是做这个行业的,但至少大家做一些小游戏来自娱自乐肯定还是没问题的。如果要练手的话可以考虑做一个2048,doodle jump这些比较简单的小游戏。

总结

如果只是寻找Python的新手入门项目,网上随便搜索一下出来的结果是非常多的。但是这并没有太多的意义,因为 这些项目并不一定适合每一个人 。而在明确自己想要从事的方向之前,合适与不合适也无从谈起,所以希望大家都可以 先明确自己的方向 ,之后再找到对应的进阶道路则要容易得多。所以如果你之前只是想要学好Python这门语言,但是又没有考虑过方向相关的话,我建议你可以思考一下这方面的问题。

Read More

Kaggle竞赛入门实战——机器学习预测房屋价格

安利十二个常用的IPython魔法命令

20年前的几行代码竟如此牛逼?惊了

End

奶糖猫   

优秀的人都在看   

在看点一下

分享到: