งานที่ตีพิมพ์ในวารสาร Nucleic Acids Research เกิดจากการร่วมแรงระหว่างชาติซึ่งนำโดย Michael Tress จากหน่วย CNIO Bioinformatics Unit พร้อมด้วยนักค้นคว้าจาก Wellcome Trust Sanger Institute ในสหราชอาณาจักรMassachusetts Institute of Technology ในสหรัฐอเมริกา มหาวิทยาลัย Pompeu Fabra แล้วก็ศูนย์ข้อมูลแห่งชาติสำหรับซูเปอร์คอมพิวเตอร์ (BSC-CNS) ในบาร์เซโลนาและก็ National Center for Cardiovascular Research (CNIC) ในกรุงมาดริด

นับตั้งแต่เสร็จสิ้นการจัดลำดับจีโนมมนุษย์ในปีพ.ศ. 2546 ผู้ที่มีความเชี่ยวชาญจากทั่วทั้งโลกต่างทำงานเพื่อเก็บรวบรวมโปรตีนมนุษย์ในที่สุด (ปริมาณโปรตีนทั้งหมดทั้งปวงที่สร้างขึ้นจากยีนแล้วก็ยีนที่ผลิตได้ งานนี้มีเยอะแยะเป็นอันมากเนื่องมาจากความสลับซับซ้อนของจีโนมมนุษย์และก็ข้อเท็จจริงที่ว่าเรามียีนเข้ารหัสโดยประมาณ 20,000 ตัว

นักวิจัยได้วิเคราะห์ยีนที่จัดทำเป็นโปรตีนสำหรับในการอ้างอิงของโปรตีนมนุษย์การเปรียบเทียบรายละเอียดของ proteomes อ้างอิงจากGENCODE / Ensembl, RefSeq และ UniProtKB พบยีนที่เข้ารหัสได้ 22,210 ยีน แม้กระนั้นมีเพียง 19,446 ยีนที่แสดงอยู่ในทั้งยัง คำอธิบายประกอบ

เมื่อวิเคราะห์ยีน 2,764 ตัวที่มีอยู่ในคำอธิบายประกอบคำอ้างอิงเพียงแค่หนึ่งหรือสองเล่มพวกเขาประหลาดใจที่ศึกษาค้นพบว่าหลักฐานการทดสอบรวมทั้งคำชี้แจงประกอบด้วยตัวเองแสดงให้เห็นว่ายีนเหล่านี้แทบทั้งสิ้นมีลักษณะท่าทางที่จะเป็นยีนที่ไม่เข้ารหัสหรือเป็นตัวยั้ง ในความจริงยีนพวกนี้ร่วมกับอีก 1,470 ยีนเข้ารหัสที่มีอยู่ในแคตตาล็อกการอ้างอิง ประเภทไม่ได้มีการปรับปรุงอย่างกับยีนรหัสโปรตีนทั่วไป บทสรุปของการเรียนเป็นยีนพวกนี้ 4,234 ส่วนบางทีอาจมิได้เป็นรหัสสำหรับโปรตีน

จากที่นักวิทยาศาสตร์กล่าว เราสามารถพินิจพิจารณายีนเหล่านี้ได้ในเนื้อหามาก” Tress อธิบาย และก็ยีนมากกว่า 300 ยีนได้รับการจำแนกประเภทใหม่ให้เป็นแบบ non-coding” ผลวิจัยนี้ได้รวมอยู่ในคำชี้แจงประกอบใหม่ของจีโนมมนุษย์โดยกลุ่มประเทศGENCODE ซึ่งเป็นส่วนหนึ่งส่วนใดของนักค้นคว้า CNIO