สำหรับความผันแปรที่เห็นได้ชัดระหว่างคน รหัสพันธุกรรมของมนุษย์นั้นเหมือนกันจริง ๆ ถึง 99.5 เปอร์เซ็นต์จากคนสู่คน ร้อยละครึ่งของปัจเจกชนที่เหลืออยู่นั้นสามารถช่วยอธิบายได้ว่าโรคต่างๆ เกิดขึ้นได้อย่างไรในบางคนและไม่ใช่ในคนอื่นๆ นักวิจัยที่ศึกษาความสัมพันธ์ทั่วทั้งจีโนมอาศัยผลลัพธ์จากโครงการใหญ่สองโครงการเพื่อนำทางพวกเขาไปสู่ส่วนที่สำคัญเหล่านี้โครงการแรกคือโครงการจีโนมมนุษย์ที่ได้รับการสนับสนุนจากรัฐบาล โดยวิเคราะห์รูปแบบจีโนมมนุษย์และคัดลอก “ตัวอักษรทางพันธุกรรม” ของนิวคลีโอไทด์ 3.2 พันล้านตัวที่ประกอบกันเป็นดีเอ็นเอของมนุษย์ เมื่อใช้เฟรมเวิร์กนี้ โครงการ International HapMap ที่ไม่แสวงหาผลกำไรจะระบุตำแหน่งเฉพาะ 11 ล้านแห่งตามจีโนมที่ข้อมูลทางพันธุกรรมแตกต่างกันด้วยตัวอักษรตัวเดียว จนถึงตอนนี้มีเว็บไซต์ประมาณ 4 ล้านแห่งที่ได้รับการจัดหมวดหมู่
โดยปกติแล้วไซต์ที่มีตัวอักษรเดียวเหล่านี้เรียกว่า
single nucleotide polymorphisms หรือ SNPs (ออกเสียงว่า “snips”) จะไม่ทำให้เกิดโรค แต่ SNPs มักจะอยู่ใกล้ยีนสำคัญที่สามารถทำได้ ดังนั้น SNP จึงทำหน้าที่เป็นป้ายบอกทางที่สะดวก โดยชี้ให้นักวิจัยเห็นถึงยีนที่เกี่ยวข้องกับโรคที่สำคัญในละแวกนั้น
หากต้องการค้นหา SNPs ที่เชื่อมโยงกับโรคบางอย่าง วิธีที่ง่ายที่สุดคือการเปรียบเทียบกลุ่มอาสาสมัครแบบเคียงข้างกัน นักวิจัยคัดเลือกกลุ่มผู้ป่วยมะเร็งเต้านมและกลุ่มคนที่คล้ายกันซึ่งไม่เป็นมะเร็งเต้านม นักวิจัยใช้ “ชิป SNP” ซึ่งเป็นไมโครชิปที่ทดสอบ SNP ที่เลือกได้มากถึง 1 ล้านตัวในคราวเดียวและบันทึกเวอร์ชันของ SNP แต่ละตัวที่แต่ละคนมีอยู่
จากนั้นนักวิจัยจะเปรียบเทียบ SNPs ในกลุ่มทางสถิติ หากผู้ป่วยมะเร็งเต้านมส่วนใหญ่มี SNP เวอร์ชัน “T” สองเวอร์ชันที่รู้จักกันในชื่อ ESR1002 เป็นต้น และอาสาสมัครที่ไม่เป็นโรคส่วนใหญ่มีเวอร์ชัน “G” สองเวอร์ชัน นักวิจัยจะระบุว่า ESR1002 เป็นมะเร็งเต้านมที่น่าสงสัย การตรวจสอบเพิ่มเติมอาจชี้ไปที่ยีนที่สำคัญในบริเวณใกล้เคียง
ถึงกระนั้น SNP นับล้านบนชิปก็ยังหมายถึงผู้ต้องสงสัย
ที่อาจเป็นไปได้หลายล้านคนที่ต้องคัดกรองซึ่งส่วนใหญ่ไม่เกี่ยวข้องกับโรคในท้ายที่สุด ข้อมูลที่ท่วมท้นอาจท่วมท้น ดังที่ชื่อ บทบรรณาธิการ วารสารการแพทย์นิวอิงแลนด์เมื่อฤดูร้อนที่แล้วอธิบายไว้ การศึกษาความสัมพันธ์ของจีโนมทั่วทั้งจีโนมเปรียบเสมือน “การดื่มจากท่อดับเพลิง”
ในความเป็นจริง วิธีการทางสถิติส่วนใหญ่ถูกสร้างขึ้นเพื่อจัดการกับความขาดแคลนข้อมูล ไม่ใช่เพื่อจัดการกับข้อมูลจำนวนมาก ดังนั้นเมื่อการสแกนจีโนมให้ข้อมูล-มีข้อมูลมากกว่าในการศึกษาระบาดวิทยาแบบดั้งเดิมถึงสี่ถึงห้าพันเท่า-วิธีการทางสถิติมาตรฐานอาจทำให้หายใจไม่ออกได้ง่าย
ตัวอย่างเช่น การศึกษาความสัมพันธ์ทั่วทั้งจีโนมของ 1 ล้าน SNP จะตั้งค่าสถานะ SNP ประมาณ 50,000 รายการว่ามีนัยสำคัญ แต่ส่วนใหญ่จะเป็น False Alarm แยกไม่ออกจากผลลัพธ์จริง ที่แย่กว่านั้น SNP ที่น่าสนใจอย่างแท้จริงอาจถูกเพิกเฉยและไม่ถูกตั้งค่าสถานะตั้งแต่แรก
ปัญหาอยู่ที่ผลลัพธ์จะถูกตั้งค่าสถานะอย่างไร วิธีการทางสถิติโดยพื้นฐานแล้วตั้งค่าจุดตัดที่ผลลัพธ์ใด ๆ จะต้องเกินก่อนที่จะถูกตั้งค่าสถานะเป็นนัยสำคัญ-อุปสรรค์ทางสถิติในแง่หนึ่ง เครื่องกีดขวางแบบดั้งเดิมทำได้ดีในการแยกผลลัพธ์ที่แท้จริงออกจากผลลัพธ์ปลอมเมื่อไม่มีผู้แข่งขันจำนวนมากในการแข่งขัน แต่ในการโจมตีแบบสายฟ้าแลบ SNP นับล้าน ผลลัพธ์ที่ผิดพลาดมากเกินไปสามารถจัดการเพื่อช่วงชิงสิ่งกีดขวางได้เพียงแค่โชคไม่เข้าข้าง
“ในอดีตเคยมีปัญหาเมื่อผู้คนประกาศชัยชนะก่อนเวลาอันควร” Joel Hirschhorn นักพันธุศาสตร์แห่ง Broad Institute กล่าว โดยประกาศว่า SNP มีความสำคัญตามอุปสรรคทางสถิติแบบดั้งเดิมเท่านั้น “เป็นการยากที่จะโน้มน้าวผู้คนว่า [ระดับเดิม] ไม่ใช่เกณฑ์ที่เหมาะสม ตอนนี้ผู้คนเริ่มยอมรับสิ่งนั้นแล้ว”
ทางออกที่ง่ายที่สุดคือการเพิ่มสิ่งกีดขวาง ตามเนื้อผ้า นักวิจัยอนุญาตให้ผลลัพธ์ปลอมแอบผ่านได้ประมาณ 1 ครั้งใน 20 ครั้ง ด้วยการสแกนทั่วทั้งจีโนมแบบใหม่ ตอนนี้มักจะไม่เกิน 5 ใน 100 ล้าน นี่เป็นการยกระดับอย่างมาก Hirschhorn กล่าว
Credit : patrickgodschalk.com
viagraonlinesenzaricetta.net
sandpointcommunityradio.com
citizenscityhall.com
olkultur.com
arcclinicalservices.org
kleinerhase.com
realitykings4u.com
mobarawalker.com
getyourgamefeeton.com