Python爬虫开发从入门到实战:Python基础

分类: 开发语言 > Python

第2章 Python基础

Python(中文发音为派森,原意为蟒蛇,因此其图标为两只蟒蛇)是一门高级程序开发语言。
所谓“高级程序开发语言”,是相对于“低级程序开发语言”来说的。
Python的语法接近正常的英语语法,因此即使不会编程,只要懂得基本的英语,也可以大致看懂Python代码。

通过这一章的学习,你将会掌握如下知识。
    (1)Python开发环境的搭建。
    (2)Python的基本知识、数据类型。
    (3)Python的条件语句和循环语句。
    (4)Python函数的定义和使用。
    (5)基于Python的面向对象编程代码。

2.1  Python的安装和运行
        由于历史原因,Python有两个主要的大版本:Python 2与Python 3。这两个大版本同时在往各自的方向发展。绝大多数的Python代码在这两个大版本中可以通用,但也有少数代码只能在Python 2中运行,或者只能在Python 3中运行。
        Python官方曾经宣布,在今后的发展中,Python 3 的升级会增加新功能,而Python 2的升级只会做错误修正,不会增加新的功能。
    2.1.1  在Windows中安装Python
        使用Windows 操作系统的读者,可访问https://www.python.org/ ftp/python/3.6.1/python-3.6.1-amd64.exe下载Python 3.6.1或者更高版本的安装程序。下载完成以后,双击这个安装程序。安装过程中,一定要勾选“Add Python 3.6 to PATH”复选框,这一点非常重要。然后选择“Install Now”选项,即可开始安装Python 3.6.1。
    2.1.2  在Mac OS中安装Python
        Mac OS系统自带Python 2。对于Python 3,有两种不同的安装方法。
        如果有编程基础,或者会使用Homebrew,可以通过Homebrew安装Python 3,其安装命令为:brew install python3
        对于没有编程基础或者没有Homebrew的,可以访问https://www.python.org/ftp/python/3.6.1/python-3.6.1-macosx10.6.pkg
    2.1.3  在Linux中安装Python
        Ubuntu 16.04或者更高版本的系统自带了Python 3.5.1或者更高版本的Python
        如果Ubuntu版本为16.04,直接在终端中输入以下几条命令来安装Python 3.6.1即可:
sudo add-apt-repository ppa:fkrull/deadsnakes
sudo apt-get update
sudo apt-get install python3.6 python3-dev python3-pip libxml2-dev libxslt1-dev zlib1g-dev libffi-dev libssl-dev
        如果系统为16.10或者17.04,那么安装Python 3.6非常简单,不需要添加软件源,直接使用“apt-get”安装即可:
sudo apt-get update
sudo apt-get install python3.6 python3-dev python3-pip libxml2-dev libxslt1-dev zlib1g-dev libffi-dev libssl-dev

2.2  Python开发环境
    2.2.1  PyCharm介绍与安装
        本书使用的集成开发环境为JetBrains公司的PyCharm。
        PyCharm在Windows、Mac OS和Linux中均有安装文件。
        网站提供了社区版(Community Edition)和专业版(Professional Edition),其中,社区版对个人用户是免费的

2.3  Python的数据结构和控制结构
    2.3.1  整数、浮点数和变量
        1.整数与浮点数
         Python里面的整数和数学里面的整数定义是一样的,Python里面的浮点数可以看作是数学里面的小数。在Python中使用print函数打印一个整数或者浮点数,可以看到这个整数或者浮点数被原样打印了出来:
        2.变量
         所谓变量,可以理解为一个存放其他数据的盒子。使用变量可以减少重复输入
    2.3.2  字符串、列表、元组
        1.字符串(String)
        在Python中,除了整数和浮点数外,还有字符串。任何被单引号或者双引号括起来的内容都可以认为是字符串。字符串也可以赋值给变量。
        2.列表(List)
        列表是Python里面的容器之一,由方括号和方括号括起来的数据构成。里面的数据可以是整数、浮点数、字符串,也可以是另一个列表或者其他的数据结构。列表里面的每一项叫作列表的一个元素,每个元素之间使用英文逗号隔开
        3.元组(Tuple)
        元组是Python里面的容器之一,由小括号和小括号括起来的数据构成。它的外型和列表非常像,只不过列表使用的是方括号,元组使用的是小括号。“元组”中的“元”和“二元一次方程”中的“元”是同一个意思,“组”就是组合的意思。
        元组和列表的区别:列表生成以后还可以往里面继续添加数据,也可以从里面删除数据;但是元组一旦生成就不能修改。如果它里面只有整数、浮点数、字符串、另一个元组,就既不能添加数据,也不能删除数据,还不能修改里面数据的值。但是如果元组里面包含了一个列表,那么这个元组里面的列表依旧可以变化。
    2.3.3  数据的读取
        1.指定下标
        第0个元素就是指最左边的元素,-N表示导出N个元素
        在这3数据结构中,想取任何一个元素,都可以直接使用:变量名[下标]
        2.切片操作
        字符串切片以后的结果还是字符串,列表切片以后的结果还是列表,元组切片以后的结果还是元组。切片的格式为:
变量名[开始位置下标:结束位置下标:步长]
        3.拼接与修改
            (1)字符串与字符串之间可以相加,相加表示两个字符串拼接起来
            (2)元组与元组之间也可以相加,相加表示两个元组拼接起来
            (3)列表与列表之间也可以相加,相加表示两个列表拼接起来
            (4)列表可以通过下标来修改列表里面的值,格式为:变量名[下标] = 新的值
            (5)元组和字符串不能添加新的内容,不能修改元组里面的非可变容器元素,也不能修改字符串里面的某一个字符
    2.3.4  字典与集合
        1.字典
        字典就是使用大括号括起来的键(Key)值(Value)对(Key-Value对)。每个键值对之间使用英文逗号分隔,每个Key与Value之间使用英文冒号分隔。Key可以使用中文、英文或者数字,但是不能重复。Value可以是任意字符串、数字、列表、元组或者另一个字典,Value可以重复
        可以通过Key来从字典中读取对应的Value,有3种主要的格式:
            变量名[key]
            变量名.get(key)
            变量名.get(key, '在找不到key的情况下使用这个值')
        2.集合
        集合是使用大括号括起来的各种数据,集合里面的元素不能重复,集合也是无序的。
        集合最大的应用之一就是去重。
        把列表转换为集合需要使用set()函数,把集合转换为列表使用list()函数
    2.3.5  条件语句
        1.if语句
            if 可以判断真假的表达式或者是能被判断是否为空的数据结构在表达式的条件为真时运行的代码
        2.短路效应
            (1)在使用and连接的多个表达式中,只要有一个表达式不为真,那么后面的表达式就不会执行。
            (2)在使用or连接的多个表达式中,只要有一个表达式为真,那么后面的表达式就不会执行。
        3.多重条件判断
            对于多重条件的判断,需要使用“if...elif...else...”
        4.使用字典实现多重条件控制
    2.3.6  for循环与while循环
        1.for循环
         for循环的常见写法为:
for x in y:
   循环体 
        2.while循环
         while循环主要用在不知道循环需要执行多少次的情况。这种情况下,要么让程序永远运行,要么在某个特定的条件下才结束
        3.跳过本次循环与退出循环
            (1)continue关键字来跳过本次循环
            (2)break关键字结束整个循环

2.4  函数与类
    2.4.1  函数
        1.什么是函数
        所谓的函数,就是一套定义好的流程:输入数据,得到结果。
        2. 定义函数
        在Python里面,可使用def这个关键字来定义一个函数。一个函数的结构一般如下:
def 函数名(参数1, 参数2, 参数3):
    函数体第一行
    函数体第N行     return 返回值
    2.4.2  类与面向对象编程
        对象有“属性”和“方法”。“属性”就是描述这个对象的各种标签,“方法”就是这个对象可以做的动作。
        对象可以只有属性没有方法,也可以只有方法没有属性。
        首先要有类,才能有对象。
        1.如何定义一个类
        在Python中使用关键字“class”来定义一个类。类一般由以下元素构成:
            (1)类名;
            (2)父类;
            (3)初始化方法(在有些编程语言中叫作构造函数);
            (4)属性;
            (5)方法。
        2.如何读懂一个类
            (1)这个类有哪些属性(看外貌)。
            (2)这个类有哪些方法(能做什么)。
            (3)这些方法在哪里被调用(做了什么)。
            (4)这些方法的实现细节(怎么做的)。

来源:原创 发布时间:2022-05-18 16:32:50