ประสบการณ์การฟังที่ดีที่สุดอยู่บน Chrome, Firefox หรือ Safari สมัครรับเสียงสัมภาษณ์ประจำวันของ Federal Drive ใน Apple Podcasts หรือ PodcastOneผู้รับเหมาที่พยายามพัฒนาแอปพลิเคชันปัญญาประดิษฐ์สำหรับรัฐบาลต้องเผชิญกับความท้าทาย นั่นคือชุดข้อมูลที่ดีสำหรับการฝึกอบรมอัลกอริทึม ขณะนี้ชุดข้อมูลใหม่ที่มุ่งเน้นของรัฐบาลกลางกำลังมาจากแหล่งที่ไม่น่าเป็นไปได้ Federal Drive กับ Tom Temin ได้รับรายละเอียดจากนักข่าว Bloomberg Government Josh Axelrod
ข้อมูลเชิงลึกโดย DocuSign: แบบสำรวจใหม่
ของ Federal News Network แสดงให้เห็นว่าพนักงานฝ่ายทรัพยากรบุคคลของรัฐบาลทราบดีว่าหน่วยงานต่างๆ จะต้องเร่งความเร็วและปรับปรุงกระบวนการสรรหา การจ้างงาน และการรักษาพนักงาน ดาวน์โหลดรายงานการสำรวจของเราตอนนี้เพื่อเรียนรู้เพิ่มเติม
Tom Temin:อย่างแรกเลย มันมาจากไหน? เริ่มกันเลย
จอช แอ็กเซลร็อด:ดังนั้นจึงมีกลุ่มผู้มีอิทธิพลที่สแตนฟอร์ดซึ่งได้สร้างชุดข้อมูลใหม่ที่เรียกว่า “กองกฎหมาย” โดยเน้นไปที่บริบททางกฎหมายและรัฐบาลโดยเฉพาะ ให้ฉันสำรองข้อมูล และบอกคุณเกี่ยวกับโมเดลพื้นฐาน ซึ่งพวกเขากำลังพยายามสร้างโมเดลพื้นฐานที่ดีกว่า โดยพื้นฐานแล้ว ถ้าคุณใช้เหมือนแถวของ Encyclopedia Britannica และคุณพยายามรวมมันทั้งหมดลงในเครื่อง แล้วจากนั้น ใช้เครื่องนั้นในการตัดสินใจ เรียนรู้บางสิ่งจากข้อมูลที่คุณให้ไว้ โมเดลพื้นฐานจำนวนมาก ซึ่งเป็นคำศัพท์ที่มาจากกลุ่ม Stanford นี้ และตอนนี้ใช้กันอย่างแพร่หลายทั่วทั้งอุตสาหกรรม พวกเขารับข้อมูลจากอินเทอร์เน็ตสาธารณะ ดังนั้นอินเทอร์เน็ต คุณก็รู้ว่าฉันเป็นแฟนของอินเทอร์เน็ตพอๆ กับผู้ชายคนต่อไป แต่ก็มีเรื่องแย่ๆ มากมายอยู่ที่นั่น และโมเดลพื้นฐานได้รับการฝึกฝนในอดีตโดยใช้โซเชียลมีเดีย, Wikipedia, Reddit ตัวอย่างเช่น ใช่ ถ้าคุณพยายามสอนแบบจำลองว่ามนุษย์พูดอย่างไร
Facebook ก็จะเต็มไปด้วยคำพูดแสดงความเกลียดชัง
และนั่นก็สามารถเข้ารหัสไวยากรณ์
ที่ไม่ดีได้เช่นกัน ซึ่งคุณไม่สามารถมีในแบบจำลองได้ ดังนั้น นักวิจัยเหล่านี้จึงพยายามใช้ข้อมูลประเภทอื่น พวกเขาหันไปใช้ casebooks, รหัสกฎหมาย, เอกสารกำกับดูแล, อีกครั้ง, สิ่งต่างๆ ที่เหมาะสมกับบริบททางกฎหมายและของรัฐบาลเหล่านี้ เพื่อทำงานของการประมวลผลภาษาธรรมชาติได้อย่างมีประสิทธิภาพมากขึ้น ซึ่งจริงๆ แล้ว ที่ใช้อยู่ทั่วทั้งราชการแผ่นดินในขณะนี้
ทอม เทมิน:น่าสนใจ ดังนั้น ในบางวิธี พวกเขากำลังใช้วิธีการที่ IBM ทำเมื่อหลายปีก่อนกับโครงการที่พวกเขาเรียกว่า Watson ซึ่งพวกเขาจะนำเนื้อหาที่ผ่านการตรวจสอบแล้วทั้งหมดหรือเนื้อหาที่ผ่านการตรวจสอบโดยเพื่อนจากโดเมนที่กำหนดและใส่ลงในฐานข้อมูล พวกเขา มีปัญหาในการขาย ฉันไม่แน่ใจว่ามันทำงานได้ดีเพียงใด มันชนะอันตราย แต่นั่นเป็นสิ่งที่ดูเหมือนที่นี่
Josh Axelrod:นั่นคือสิ่งที่พวกเขาทำคือรวบรวมคลังข้อมูลนี้ จริงๆแล้วมันมีขนาดมากกว่า 250 กิกะไบต์ และเป็นโอเพ่นซอร์สทั้งหมด ดังนั้นโปรแกรมเมอร์สามารถเข้ามาดูข้อมูลนั้น ปรับแต่งและใช้ข้อมูลนั้นเพื่อสร้างแบบจำลองของตนเอง และอีกครั้ง มันจะเหมาะสมกว่าสำหรับผู้ติดต่อด้านกฎระเบียบเหล่านี้ มีห้าประเด็นหลักที่รัฐบาลใช้ AI และการประมวลผลภาษาธรรมชาติ ซึ่งสิ่งนี้สามารถเพิ่มเติมได้
Tom Temin:และพื้นที่เหล่านั้นคือ?
credit : 3daysofsyllamo.org makedigitalworldeasy.org thaidiary.net flashpoetry.net coachfactoryoutletstoreco.com glimpsescience.net sylvanianvillage.com royalnepaleseembassy.org 21stcenturybackcare.com coachfactoryonlinea.net