Score:1

การจับคู่รูปแบบโดยใช้ Grep

ธง bd

ฉันกำลังพยายามหาค่าเฉพาะสำหรับไฟล์ของฉัน นี่คือตัวอย่างสั้นๆ ของมัน:

PRODUCT_TYPE_NAME,PRODUCT_CLASS_NAME,PRODUCT_SUB_CLASS_NAME,PRODUCT_MINOR_CLASS_NAME,PRODUCT_COUNTRY_ORIGIN_NAME,PRODUCT_SKU_NO,PRODUCT_LONG_NAME,PRODUCT_BASE_UPC_NO,PRODUCT_LITRES_PER_CONTAINER,PRCOD_CONTAINER_PER_SELL_UNIT,PRODUCT_ALCOHOL_PRENT_PRENT_PLAYSDIENT,PRODUCT_ALCOHOL_PRENT_PRENT_PLAYSDIENT
สุรา,ไวน์,ไวน์โต๊ะ,ไวน์แดง,แคนาดา,198267,ทองแดงมูน - MALBEC,48162013513,3,1,14,30.99,0
สุรา,ไวน์,ไวน์โต๊ะ,ไวน์ขาว,แคนาดา,305375,DOMAINE D'OR - DRY,48162001886,4,1,11.5,32.99,0
สุรา,ไวน์,ไวน์โต๊ะ,ไวน์แดง,แคนาดา,53017,ซอมเม็ทรูจ,58976055050,4,1,12,29.99,0
สุรา,ไวน์,ไวน์โต๊ะ,ไวน์ขาว,แคนาดา,215525,มิชชั่นริดจ์ - พรีเมี่ยมดรายไวท์,779646155251,4,1,11,33.99,1
สุรา,ไวน์,ไวน์โต๊ะ,โต๊ะไวน์แดง,สหรัฐอเมริกา,168971,ZINFANDEL - บ้านใหญ่พระคาร์ดินัล ZIN,81308001456,3,1,13.5,36.99,0
สุรา,ไวน์,ไวน์โต๊ะ,ไวน์แดง,ฝรั่งเศส,234559,LE VILLAGEOIS RED - CELLIERS LA SALLE,63657001448,4,1,11,34.99,0
สุรา,ไวน์,ไวน์โต๊ะ,โต๊ะไวน์แดง,แคนาดา,492314,SAWMILL CREEK - MERLOT,63657004074,16,1,12.5,119,0
สุรา,ไวน์,ไวน์โต๊ะ,ไวน์ขาว,แคนาดา,587584,SOLA,63657006566,4,1,12,32.99,0
สุรา,ไวน์,ไวน์โต๊ะ,โต๊ะไวน์ขาว,แคนาดา,100925,GANTON & LARSEN PROSPECT - PINOT BLANC BIRCH CANOE 2011,776545400000,0.75,1,11.5,13.99,0
สุรา,สุรา,ไอริชวิสกี้,ไอริชวิสกี้,ไอร์แลนด์,10157,JAMESON - IRISH,80432500170,0.75,1,40,34.99,NA
สุรา,ไวน์,ไวน์โต๊ะ,ไวน์โต๊ะขาว,อิตาลี,102764,PINOT GRIGIO DELLE VENEZIE - RUFFINO LUMINA,8001660197156,0.75,1,12.5,15.99,0
สุรา,สุรา,อเมริกันวิสกี้,อเมริกันวิสกี้,สหรัฐอเมริกา,103747,MAKER'S MARK - KENTUCKY BOURBON,85246139431,0.75,1,45,44.95,NA
สุรา,สุรา,จิน,ดรายจิน,แคนาดา,1040,กอร์ดอน - ลอนดอนดราย,622153139040,0.75,1,40,24.49,NA
สุรา,ไวน์,ไวน์โต๊ะ,ไวน์โต๊ะขาว,แคนาดา,104679,CALONA - ARTIST SERIES RESERVE PINOT GRIS 2011/13,58976501656,0.75,1,13.5,12.99,0
สุรา,ไวน์,ไวน์โต๊ะ,ไวน์แดง,สหรัฐอเมริกา,106476,PINOT NOIR - SIDURI RUSSIAN RIVER 11/12,626990184140,0.75,1,14.5,49.99,0
สุรา,สุรา,CACHACA,CACHACA,บราซิล,107029,CACHACA 61,7896547500676,0.7,1,40,28.95,2
สุรา,ไวน์,ไวน์โต๊ะ,ไวน์แดง,ฝรั่งเศส,109082,ชาโตว์ปาวีเดซี 2008,,0.75,1,13,239,0
สุรา,สุรา,สก็อตวิสกี้,สก็อต - เบลนด์,สหราชอาณาจักร,1099,จอห์นนี่ วอล์กเกอร์ - ฉลากแดง,622153631049,0.75,1,40,29.99,NA
สุรา,ไวน์,ไวน์โต๊ะ,ไวน์แดง,อิตาลี,110460,LE CONTRADE - CO.PRO.VI,8004753004010,1,1,12,9.9,0
LIQUOR,SPIRITS,RUM,DARK,CANADA,112433,BACARDI - BLACK,620213055408,0.75,1,40,23.75,NA
สุรา,ไวน์,ของหวานเรียกน้ำย่อยและไวน์เสริม,MONTILLA,สเปน,112789,ALVEAR - MEDIUM DRY,766238303374,0.75,1,17,17.99,3
สุรา,สุรา,สก็อตวิสกี้,สก็อต - เบลนด์,สหราชอาณาจักร,112896,จอห์นนี่ วอล์กเกอร์ - ฉลากแดง,622153631070,1.75,1,40,68.99,NA

ตอนนี้ฉันต้องใช้ grep ฉันต้องการถ้าโซลูชันไม่เกี่ยวข้องกับ sed, perl, awk หรือลูป ฉันเหนื่อย:

grep -E "^.*(,.*){9}[^0]+" BC_Liquor_Store_Product_Price_List.csv

แต่เห็นได้ชัดว่าได้รับทุกอย่าง ฉันต้องได้รับแถวทั้งหมดที่มี PRODUCT_LITRES_PER_CONTAINER >= 1 แต่ฉันไม่สามารถเข้าใจได้ .* รับทุกอย่าง แต่ก่อน the มีคำที่ฉันทำไม่ได้:

grep -E "^(,.*){9}[^0]+" BC_Liquor_Store_Product_Price_List.csv

ซึ่งจะจับคู่เฉพาะบรรทัดที่ขึ้นต้นด้วย ,?

hr flag
*"ฉันต้องการมากกว่าถ้าโซลูชันไม่เกี่ยวข้องกับ sed, perl, awk หรือลูป"* เพราะเหตุใด ทำไมต้องทำให้ชีวิตยากขึ้นโดยใช้เครื่องมือที่ไม่ถูกต้องสำหรับงาน?
Yunfei Chen avatar
bd flag
@steeldriver ฉันมีระบบที่มีข้อจำกัดบางอย่าง ดังนั้นฉันจึงต้องการให้มันเป็นข้ามแพลตฟอร์ม และฝังตัวอยู่ในระบบ ดังนั้นฉันจึงไม่ต้องการพบปัญหาใดๆ ในภายหลัง... นอกจากนี้ยังมีวิธีแก้ปัญหามากมายด้วย awk และ perl ทางออนไลน์ นี่เป็นเพียงการใช้ grep แต่ไม่มีวิธีแก้ปัญหาโดยใช้ grep...
Yunfei Chen avatar
bd flag
สิ่งนี้เป็นไปได้แน่นอนโดยใช้ grep??
terdon avatar
cn flag
`grep` พกพาสะดวกน้อยกว่า sed, awk หรือ perl เหตุใดคุณจึงต้องการโซลูชันที่พกพาได้น้อยที่สุด
gy flag
@steeldriver น่าจะเป็นเพราะมันเป็นงานเดียวกันกับ https://unix.stackexchange.com/questions/653643/grep-and-cut-command-in-linux ?
Score:4
ธง hr

ดู “ตอนนี้คุณมีปัญหา 2 ข้อ” หมายความว่าอย่างไร

บางคนเมื่อเผชิญกับปัญหา คิดว่า "ฉันรู้ ฉันจะใช้นิพจน์ทั่วไป" ตอนนี้พวกเขามีสองปัญหา - เจมี่ ซาวินสกี้

สิ่งที่คุณดูเหมือนจะเข้าใจคือ

grep -E "^([^,]*,){8}[^0]" BC_Liquor_Store_Product_Price_List.csv

นั่นคือ

  • ทอดสมออยู่ที่จุดเริ่มต้นของบรรทัด ^
  • จับคู่อักขระที่ไม่ใช่เครื่องหมายจุลภาคจำนวนเท่าใดก็ได้ตามด้วยเครื่องหมายจุลภาค 8 ครั้ง
  • จากนั้นจับคู่ที่ไม่ใช่0 ตัวละครที่จุดเริ่มต้นของฟิลด์ที่ 9

อย่างไรก็ตาม IMHO นี้มีความเปราะบางและไม่ควรใช้ในการใช้งานที่ร้ายแรงใดๆ เป็นการยากที่จะจับคู่ค่าตัวเลขได้อย่างน่าเชื่อถือ - ดูตัวอย่าง

โดยเฉพาะส่วน "หมายเหตุเกี่ยวกับการจับคู่ตัวเลข (คำแนะนำ: ยากกว่าที่คิด)". โปรดพิจารณาแทนการใช้สิ่งที่ชอบ

awk -F, 'NR==1 || $9+0 > 1.0' BC_Liquor_Store_Product_Price_List.csv

หรือ

perl -F, -lne 'พิมพ์ if $ == 1 || $F[8] >= 1.0' BC_Liquor_Store_Product_Price_List.csv

หรือ (ดีกว่า เนื่องจากจะจัดการกับคุณสมบัติ CSV ที่ซับซ้อน เช่น เครื่องหมายคำพูดและเครื่องหมายจุลภาคแบบฝัง)

mlr --csv ตัวกรอง '$PRODUCT_LITRES_PER_CONTAINER >= 1.0' BC_Liquor_Store_Product_Price_List.csv
Yunfei Chen avatar
bd flag
คุณหมายถึงอะไรโดยเปราะบาง??
hr flag
เอาล่ะ จากหัวของฉัน - หากฟิลด์ว่างเปล่า `[^0]` จะตรงกับ `,` ต่อไปนี้ - เวอร์ชัน Awk และ Miller จะบีบบังคับสตริงว่างให้เป็นตัวเลข 0 ทั้งคู่ (อย่างถูกต้อง) และด้วยเหตุนี้จึงไม่รวม ผลลัพธ์. มีแนวโน้มว่าจะมีกรณีขอบอื่น ๆ - ด้วยเหตุนี้จึงเป็นคำพูด ;)

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา