ขั้นตอนแรกคือการออกแบบตารางและคอลัมน์สำหรับฐานข้อมูล กำหนดวิธีจัดเก็บข้อมูลเมตา ออกแบบคำสั่งคิวรีและคำสั่งอัปเดต
จากนั้นใช้ทริกเกอร์ Cloud Storage เพื่อแจ้งบริการที่คุณเขียนเพื่อประมวลผลเหตุการณ์จาก Cloud Storage มักใช้ Cloud Functions และ Cloud Run เพื่อประมวลผลเหตุการณ์ต่างๆ ในการประมวลผลเหตุการณ์ รหัสของคุณจะอัปเดตฐานข้อมูล
ขั้นตอนสุดท้ายหลังจากทริกเกอร์ทำงานอย่างถูกต้องคือสแกนบัคเก็ตทั้งหมดและอัปเดตฐานข้อมูลด้วยข้อมูลเมตาสำหรับออบเจ็กต์ Cloud Storage แต่ละรายการ
คำถามของคุณไม่มีรายละเอียด ควรใช้คำสั่งตัวเลขแทน ฉันมีวัตถุจำนวนมากที่จัดเก็บไว้ใน GCP Cloud Storage Bucket. สำหรับฉันนั่นหมายถึงวัตถุนับสิบล้านอย่างต่ำ คำถามของคุณไม่มีข้อมูลเกี่ยวกับการเปลี่ยนแปลงที่เกิดขึ้นอย่างรวดเร็วใน Cloud Storage หรือการสืบค้นจริงที่คุณต้องดำเนินการ
โปรดทราบว่า Cloud Storage เป็นเนมสเปซแบบแบน แนวคิดของลำดับชั้น (โฟลเดอร์/ไดเร็กทอรี) ถูกเลียนแบบในซอฟต์แวร์ หากคุณจัดเก็บเนมสเปซในฐานข้อมูลเหมือนกับที่จัดเก็บใน Cloud Storage ประสิทธิภาพอาจไม่ดีขึ้น
ฉันได้ใช้งานการออกแบบประเภทของคุณหลายครั้งสำหรับ AWS, Google Cloud และ Azure เว้นแต่ว่าคุณต้องการความซับซ้อนของระบบที่ขับเคลื่อนด้วยเหตุการณ์จริงๆ ฉันขอแนะนำให้อ่านบัคเก็ตพื้นที่เก็บข้อมูลนานๆ ครั้ง และสร้างสเปรดชีตข้อความง่ายๆ ที่สามารถประมวลผลด้วย grep, awk เป็นต้น