歡迎光臨
每天分享高質量文章

Python高效編程的5大技巧

來自公眾號:Python編程與實戰

 

工作中經常要處理各種各樣的資料,遇到專案趕進度的時候自己寫函式容易浪費時間。

Python 中有很多內置函式幫你提高工作效率!

一:根據條件在序列中篩選資料

1.假設有一個數字串列 data, 過濾串列中的負數

使用串列推導式:

result = [i for i in data if i >= 0]

使用 fliter 過濾函式:

result = fliter(lambda x: x>= 0, data)

2.學生的數學分數以字典形式儲存,篩選其中分數大於 80 分的同學

d = {x:randint(50100for x in range(121)}
{k: v for k, v in d.items() if v > 80}

二:對字典的鍵值對進行翻轉

使用 zip() 函式

zip() 函式用於將可迭代的物件作為引數,將物件中對應的元素打包成一個個元組,然後傳回由這些元組組成的串列。

>>> s1 = {x: randint(14for x in sample('abfcdrg', randint(1,5))}
>>> s1
{'b'1'f'4'g'3'r'1}
>>> d = {k:v for k, v in zip(s1.values(), s1.keys())}
>>> d
{1'r'4'f'3'g'}

三. 統計序列中元素出現的頻度

1.某隨機序列中,找到出現次數最高的3個元素,它們出現的次數是多少?

構造隨機序列如下:

data = [randint(0,20for _ in range(20)]

方法1: 可以使用字典來統計,以串列中的資料為鍵,以出現的次數為值

from random import randint

def demo():
    data = [randint(020for _ in range(30)]
    # 串列中出現數字出現的次數
    d = dict.fromkeys(data, 0)
    for v in li:
        d[v] += 1
    return d

方法2:直接使用 collections 模塊下麵的 Counter 物件

>>> data = [randint(020for _ in range(30)]
>>> data
[78516101681711181117157219516171712199100201121110]
>>> c2 = Counter(data)
>>> c2
Counter({174114163103728252221921811511219101201})
>>> c2[14]
4
>>> c2.most_common(3)  # 統計頻度出現最高的3個數
[(174), (114), (163)]

2. 對某英文文章單詞進行統計,找到出現次數最高的單詞以及出現的次數

通過上面的練習,我們知道可以用 Counter 來解決

import re
from collections import Counter

# 統計某個文章中英文單詞的詞頻

with open('test.txt''r', encoding='utf-8')as f:
    d = f.read()

total = re.split('W+', d)  # 所有的單詞串列
result = Counter(total)
print(result.most_common(10))

四.根據字典中值的大小,對字典中的項進行排序

比如班級中學生的數學成績以字典的形式儲存:

{"Lnad"88"Jim"71...}

請按數學成績從高到底進行排序!

方法1: 利用 zip 將字典轉化為元組,再用 sorted 進行排序

>>> data = {x: randint(60100for x in "xyzfafs"}
>>> data
{'x'73'y'69'z'76'f'61'a'64's'100}
>>> sorted(data)
['a''f''s''x''y''z']
>>> data = sorted(zip(data.values(), data.keys()))
>>> data
[(61'f'), (64'a'), (69'y'), (73'x'), (76'z'), (100's')]

方法2: 利用 sorted 函式的 key 引數

>>> data.items()
>>> dict_items([('x'64), ('y'74), ('z'66), ('f'62), ('a'80), ('s'72)])
>>> sorted(data.items(), key=lambda x: x[1])
[('f'62), ('x'64), ('z'66), ('s'72), ('y'74), ('a'80)]

五. 在多個字典中找到公共鍵

實際場景:在足球聯賽中,統計每輪比賽都有進球的球員

第一輪:{“C羅”: 1, “蘇亞雷斯”:2, “托雷斯”: 1..}
第二輪:{“內馬爾”: 1, “梅西”:2, “姆巴佩”: 3..}
第三輪:{“姆巴佩”: 2, “C羅”:2, “內馬爾”: 1..}

模擬隨機的進球球員和進球數

>>> s1 = {x: randint(14for x in sample('abfcdrg', randint(1,5))}
>>> s1
{'d'3'g'2}
>>> s2 = {x: randint(14for x in sample('abfcdrg', randint(1,5))}
>>> s2
{'b'4'g'1'f'1'r'4'd'3}
>>> s3 = {x: randint(14for x in sample('abfcdrg', randint(1,5))}
>>> s3
{'b'4'r'4'a'2'g'3'c'4}

首先獲取字典的 keys,然後取每輪比賽 key 的交集。由於比賽輪次數是不定的,所以使用 map 來批量操作

map(dict.keys, [s1, s2, s3])

然後一直累積取其交集,使用 reduce 函式

reduce(lambda x,y: x & y, map(dict.keys, [s1, s2, s3]))

一行代碼搞定!


已同步到看一看
赞(0)

分享創造快樂