ฉันมีไฟล์บันทึกดังต่อไปนี้:
12-02-2022 15:18:22 +0330 SOCK5.6699 00000 user144 97.251.107.125:38605 1.1.1.1:443 51766 169369 0 CONNECT 1.1.1.1:443
12-02-2022 15:18:27 +0330 SOCK5.6699 00094 user156 32.99.193.2:51242 1.1.1.1:443 715 388 0 เชื่อมต่อ 1.1.1.1:443
12-02-2022 15:18:56 +0330 SOCK5.6699 00000 user105 191.184.66.98:40048 1.1.1.1:443 18105 29029 0 CONNECT 1.1.1.1:443
12-02-2022 15:18:56 +0330 SOCK5.6699 00000 user105 191.184.66.98:40070 1.1.1.1:443 674 26805 0 CONNECT 1.1.1.1:443
12-02-2022 15:20:24 +0330 SOCK5.6699 00000 user143 112.199.63.119:60682 1.1.1.1:443 475 445 0 เชื่อมต่อ 1.1.1.1:443
12-02-2022 15:20:37 +0330 SOCK5.6699 00000 user105 191.184.66.98:40102 1.1.1.1:443 12913 18780 0 CONNECT 1.1.1.1:443
12-02-2022 15:20:42 +0330 SOCK5.6699 00000 user143 112.199.63.119:60688 1.1.1.1:443 4530 34717 0 CONNECT 1.1.1.1:443
12-02-2022 15:20:44 +0330 SOCK5.6699 00000 user127 212.167.145.49:2972 1.1.1.1:443 827 267 0 CONNECT 1.1.1.1:443
เป้าหมายของฉันคือการแตกไฟล์บันทึกนี้สองส่วน:
- ชื่อผู้ใช้
- ที่อยู่ IP ของแหล่งที่มาของผู้ใช้
ด้านล่างนี้คือตัวอย่างบางส่วนของข้อมูลที่จำเป็น
12-02-2022 15:18:22 +0330 SOCK5.6699 00000 ผู้ใช้144 97.251.107.125:38605 1.1.1.1:443 51766 169369 0 เชื่อมต่อ 1.1.1.1:443
ดังนั้นฉันจึงเขียนสคริปต์ Python เพื่อแยกทั้งสองรายการและเก็บไว้ในรายการแยกต่างหาก จากนั้นรวมเข้าด้วยกันด้วยฟังก์ชัน zip
นำเข้า pprint
คอลเลกชันนำเข้า
iplist=[]
สำหรับ l ในข้อมูล:
ip_port=l[53:71]
iplist.append(ip_port.split(':')[0])
รายชื่อผู้ใช้=[]
สำหรับคุณในข้อมูล:
ผู้ใช้ = คุณ [42:52]
userlist.append(user.replace(" ", ""))
a=list(zip(iplist,รายชื่อผู้ใช้))
most_ip=collections.Counter(a).most_common(5)
pprint.pprint(most_ip)
รหัสนี้ใช้งานได้ดีและฉันสามารถรับ ip ที่ใช้สูงสุดพร้อมชื่อผู้ใช้ที่เกี่ยวข้อง
ต้องบอกด้วยว่าฉันไม่ได้ใช้ อีกครั้ง โมดูลเนื่องจากเป็นรายการ IP ที่สอง (IP ปลายทางซึ่งเป็น 1.1.1.1- ซึ่งฉันไม่สนใจ)
คำถาม:
มีวิธีอื่น (ที่เรียบร้อยกว่านี้) มากกว่าวิธีที่ฉันเขียนโค้ดหรือไม่