מֵידָע

פתח מסדי נתונים עבור וריאציות של מספר העתקות הדומות ל-TCGA

פתח מסדי נתונים עבור וריאציות של מספר העתקות הדומות ל-TCGA


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

לאטלס גנום הסרטן (TCGA) יש נתונים פתוחים עבור וריאציה במספר העתקות (CNV) מלפחות 10,000 חולי סרטן שונים. הם מציעים שני סוגים של נתונים, נתוני CNV מגידולים ונתוני CNV מדגימות רקמה רגילות. האם יש מסדי נתונים פתוחים אחרים המציעים נתוני CNV לפחות מסוג סרטן אחד?


ל-ICGC יש נתוני CNV עבור סוגי סרטן רבים ושונים. יש לו מערכי נתונים מוגבלים ופתוחים רבים. דף ההפצות של DCC יאפשר לך לצוד אותם - אלה שהם ציבוריים מורידים בקלות. יש להם גם נתוני ביטוי, SNV, מתילציה של DNA ונתוני מוטציות מבניות עבור דגימות רבות.


CODEX2: זיהוי וריאציה של מספר עותק בספקטרום מלא על ידי רצף DNA בתפוקה גבוהה

רצף DNA בתפוקה גבוהה מאפשר זיהוי של וריאציות של מספר העתקות (CNVs) בקנה מידה רחב של הגנום עם רזולוציה עדינה יותר בהשוואה לשיטות מבוססות מערך, אך סובל מהטיות וחפצים המובילים לגילויי שווא ורגישות נמוכה. אנו מתארים את CODEX2, כמסגרת סטטיסטית לפרופיל CNV בספקטרום מלא, הרגישה לגרסאות עם תדירות אוכלוסיה נפוצה ונדירה כאחד, ואשר ישימה לעיצובי מחקר עם וללא דגימות ביקורת שליליות. אנו מדגימים ומעריכים את CODEX2 על נתוני רצף ממוקדים של אקסום שלם, כאשר ההטיות הן הבולטות ביותר. CODEX2 מתעלה על השיטות הקיימות, ובפרט, משפר משמעותית את הרגישות ל-CNVs נפוצים.


פתח מסדי נתונים עבור וריאציות של מספר העתקות בדומה ל-TCGA - ביולוגיה

וריאציה של רצף גנומי

http://www.1000genomes.org/
איסוף נתונים וקטלוג של וריאציות אנושיות

dbVar ומסד נתונים של גרסאות גנומיות

ירושה מנדלית מקוונת באדם

http://www.omim.org/about
OMIM הוא אוסף מקיף וסמכותי של גנים אנושיים ופנוטיפים גנטיים הזמין באופן חופשי ומתעדכן מדי יום. הטקסט המלא, הסקירות המוזכרות ב-OMIM מכילות מידע על כל ההפרעות המנדליות הידועות ולמעלה מ-12,000 גנים. OMIM מתמקדת בקשר בין פנוטיפ לגנוטיפ. הוא מתעדכן מדי יום, והערכים מכילים קישורים רבים למשאבים גנטיים אחרים.

The Exome Aggregation Consortium (ExAC)

http://exac.broadinstitute.org/
ExAC היא קואליציה של חוקרים המבקשת לצבור ולהרמונית נתוני רצף אקסומים ממגוון פרויקטי רצף בקנה מידה גדול, ולהפוך נתונים מסכם לזמינים עבור הקהילה המדעית הרחבה יותר. מערך הנתונים המסופק באתר זה משתרע על פני 61,486 פרטים שאינם קשורים ברצף כחלק ממחקרים גנטיים ספציפיים למחלה ואוכלוסייה. הסרנו אנשים שנפגעו ממחלת ילדים חמורה, כך שמערך נתונים זה אמור לשמש כמערכת ייחוס שימושית של תדירויות אללים למחקרי מחלות קשות. כל הנתונים הגולמיים מפרויקטים אלה עברו עיבוד מחדש דרך אותו צינור, ונקראו במשותף כדי להגביר את העקביות בין הפרויקטים.

פרויקט Encyclopedia Of DNA Elements (ENCODE).

http://encodeproject.org/
קישורים לנתוני סימני היסטון המעובדים באופן אחיד ב-ENCODE2: https://sites.google.com/site/anshulkundaje/projects/encodehistonemods
קישורים לנתונים אחרים של ENCODE2 המעובדים באופן אחיד: http://genome.ucsc.edu/ENCODE/downloads.html
איסוף נתונים, ניתוח אינטגרטיבי וקטלוג מקיף של
כל האלמנטים הפונקציונליים המבוססים על רצף

מפת דרכים אפיגנומיקה (NIH Common Fund)

Consortium Human Epigenome International (IHEC)

http://www.ihec-epigenomes.org/
איסוף נתונים ומפות התייחסות של אפיגנומים אנושיים למפתח
מצבים תאיים רלוונטיים לבריאות ולמחלות

###מפת גוף אנושית ניתנת לצפייה עם אנסמבל (http://www.ensembl.org/index.html) או עם
Integrated Genomics Viewer (http://www.broadinstitute.org/igv/)
מסד נתונים של ביטוי גנים מ- Illumina, מנתוני RNA-seq

###Cancer CellLine Encyclopedia (CCLE) http://www.broadinstitute.org/ccle/home
נתוני ביטוי מבוסס מערך, CNV, מוטציות, הפרעות על אוסף עצום של שורות תאים

###פרויקט FANTOM5 http://fantom.gsc.riken.jp/
http://fantom.gsc.riken.jp/5/sstar/Data_source
אוסף גדול של נתוני ביטוי מבוססי CAGE על פני מינים מרובים (סדרות זמן והפרעות)

http://www.ebi.ac.uk/gxa/
מסד נתונים תומך בשאילתות של ביטוי גנים ספציפי למצב על
תת-קבוצה אוצרת של ארכיון Array Express.

אטלס ביטוי גנים של GNF

ניתן לצפייה ב-BioGPS (http://biogps.org/#goto=welcome)
GNF (מכון גנומיקה של קרן המחקר של נוברטיס) נתוני מערך ביטוי הגנים של בני אדם ועכברים.

http://www.proteinatlas.org/
פרופילי ביטוי חלבון המבוססים על אימונוהיסטוכימיה עבור מספר רב של רקמות אנושיות, סרטן וקווי תאים, לוקליזציה תת-תאית, רמות ביטוי תמליל

http://www.uniprot.org/
מסד נתונים מקיף, נגיש בחינם של רצף חלבונים ו
מידע פונקציונלי

http://www.ebi.ac.uk/interpro/
מסד נתונים משולב של סיווג חלבונים, תחומים פונקציונליים,
והערה (כולל מונחי GO).

יוזמת ריאגנטים לכידת חלבון

http://commonfund.nih.gov/proteincapture/
יצירת משאבים: נוגדנים חד שבטיים מתחדשים וריאגנטים אחרים המכוונים לכל מגוון החלבונים

תוכנית נוקאאוט עכבר (KOMP)

מפת הקישוריות (CMAP)

http://www.broadinstitute.org/cmap/
מפת הקישוריות (הידועה גם בשם cmap) היא אוסף של נתוני ביטוי תעתוק רחבי גנום מתאי אדם מתורבתים שטופלו במולקולות קטנות ביו-אקטיביות ובאלגוריתמים פשוטים התואמים דפוסים המאפשרים יחד גילוי של קשרים פונקציונליים בין תרופות, גנים ומחלות באמצעות תכונה חולפת של שינויים נפוצים בביטוי גנים. אתה יכול ללמוד עוד על cmap מהמאמרים שלנו ב-Sciences Science and Nature Cancer.

ספריית חתימות סלולריות משולבות מבוססות רשת (LINCS)

https://commonfund.nih.gov/LINCS/
איסוף נתונים וניתוח של חתימות מולקולריות המתארות כיצד
סוגים שונים של תאים מגיבים למגוון גורמים מטרידים

גנומית של רגישות לתרופות בסרטן

http://www.cancerrxgene.org/
מוטציה, CNV, ביטוי אפי ורגישות לתרופות ב

מסד הנתונים של אינטראקציה בין גנים לסמים (DGIdb)

תוכנית הספריות המולקולריות (MLP)

https://commonfund.nih.gov/molecularlibraries/index.aspx
גישה ליכולת ההקרנה בקנה מידה גדול הנחוצה לזיהוי מולקולות קטנות שניתן לייעל אותן כבדיקות כימיות לחקור את הפונקציות של גנים, תאים ומסלולים ביוכימיים בבריאות ובמחלות

http://www.brain-map.org/
איסוף נתונים ומשאבים ציבוריים מקוונים המשלבים ביטוי גנים נרחב ונתונים נוירואנטומיים עבור אדם ועכבר, כולל וריאציה של ביטוי גנים של עכבר לפי זן.

http://braincloud.jhmi.edu/
BrainCloud הוא יישום זמין באופן חופשי, ידידותי לביולוגים, עצמאי לחקר הדינמיקה הטמפורלית והשליטה הגנטית של שעתוק בקליפת המוח הקדם-מצחית האנושית לאורך תוחלת החיים. BrainCloud פותחה באמצעות שיתוף פעולה בין מכון ליבר ל-NIMH

פרויקט הקשר האנושי

http://www.humanconnectomeproject.org/
איסוף נתונים ואינטגרציה ליצירת מפה מלאה של הקשרים העצביים המבניים והתפקודיים, בתוך ובין אנשים

פרויקט רצף RNA של Geuvadis של 1000 דגימות גנומים

http://www.geuvadis.org/web/geuvadis
רצף mRNA ו-RNA קטן על 465 דגימות של קו תאים לימפובלסטאידי (LCL) מ-5 אוכלוסיות של פרויקט 1000 הגנומים: ה-CEPH (CEU), הפינים (FIN), הבריטים (GBR), Toscani (TSI) ויורובה (YRI).

http://www.broadinstitute.org/achilles Project Achilles הוא מאמץ שיטתי שמטרתו לזהות ולקטלג פגיעות גנטיות על פני מאות קווי תאים סרטניים המאופיינים מבחינה גנומית. הפרויקט משתמש בספריית shRNA רחבה של הגנום כדי להשתיק גנים בודדים ולזהות את הגנים המשפיעים על הישרדות התא. סקר תפקודי בקנה מידה גדול של קווי תאים סרטניים מספק גישה משלימה לאותם מחקרים שמטרתם לאפיין את השינויים המולקולריים (מוטציות, שינויים במספר העתקים וכו') של גידולים ראשוניים, כגון אטלס גנום הסרטן. המטרה הכוללת של הפרויקט היא לקשר בין התלות הגנטית של הסרטן למאפיינים המולקולריים שלהם על מנת לזהות מטרות מולקולריות ולהנחות התפתחות טיפולית.

משאבים גנומיים להזדקנות אנושית

אטלס גנום הסרטן (TCGA)

http://cancergenome.nih.gov/
איסוף נתונים ומאגר נתונים, כולל נתוני רצף הגנום הסרטני

קונסורציום הגנום הבינלאומי לסרטן (ICGC)

http://www.icgc.org/
איסוף נתונים ומאגר נתונים לתיאור מקיף של שינויים גנומיים, טרנסקריפטומיים ואפיגנומיים של סרטן

פרויקט גנוטיפ-רקמות (GTEx).

https://commonfund.nih.gov/GTEx/
איסוף נתונים, מאגר נתונים ומאגר דגימות לביטוי וויסות גנים אנושיים ברקמות מרובות, בהשוואה לשונות גנטית

תוכנית הפנוטייפ של עכבר נוקאאוט (KOMP2)

https://commonfund.nih.gov/KOMP2/
איסוף נתונים עבור פנוטייפ סטנדרטי של אוסף רחב של הגנום של נוקאאוט עכברים

מסד נתונים של גנוטיפים ופנוטיפים (dbGaP)

http://www.ncbi.nlm.nih.gov/gap
מאגר נתונים לתוצאות ממחקרים שחקרו את האינטראקציה של גנוטיפ ופנוטיפ

קטלוג NHGRI של GWAS שפורסם

http://www.genome.gov/gwastudies/
קטלוג ציבורי של מחקרים של אגודה רחבה של הגנום שפורסמו

מסד נתונים גנומי קליני

http://research.nhgri.nih.gov/CGD/
מסד נתונים שנערך באופן ידני של מצבים עם סיבות גנטיות ידועות, המתמקד בנתונים גנטיים משמעותיים מבחינה רפואית עם התערבויות זמינות.

ליבת המידע בנושא סרטן השד של NHGRI

http://www.ncbi.nlm.nih.gov/clinvar/
ClinVar נועד לספק ארכיון ציבורי נגיש באופן חופשי של דיווחים על הקשרים בין וריאציות ופנוטיפים אנושיים, עם ראיות תומכות. ClinVar אוספת דיווחים על גרסאות שנמצאו בדגימות מטופלים, הצהרות לגבי המשמעות הקלינית שלהן, מידע על המגיש ונתונים תומכים אחרים. האללים המתוארים בהגשות ממופים לרצפי התייחסות ומדווחים על פי תקן HGVS. לאחר מכן, ClinVar מציגה את הנתונים עבור משתמשים אינטראקטיביים כמו גם לאלה המעוניינים להשתמש ב-ClinVar בזרימות עבודה יומיומיות ויישומים מקומיים אחרים. ClinVar פועלת בשיתוף פעולה עם ארגונים מתעניינים כדי לענות על הצרכים של קהילת הגנטיקה הרפואית בצורה יעילה ואפקטיבית ככל האפשר.

מסד נתונים של מוטציות גנים אנושיים (HGMD)

http://www.hgmd.cf.ac.uk/ac/
מאגר מוטציות הגנים האנושיים (HGMD®) מייצג ניסיון לאסוף נגעי גנים ידועים (שפורסם) האחראים למחלה תורשתית אנושית

NHLBI Exome Sequencing Project (ESP) Exome Variant Server

http://evs.gs.washington.edu/EVS/
המטרה של NHLBI GO Exome Sequencing Project (ESP) היא לגלות גנים ומנגנונים חדשים התורמים להפרעות לב, ריאות ודם על ידי חלוץ היישום של רצף הדור הבא של אזורי קידוד החלבון של הגנום האנושי על פני מגוון, עשיר- אוכלוסיות עם פנוטיפ ולשתף מערכי נתונים וממצאים אלה עם הקהילה המדעית כדי להרחיב ולהעשיר את האבחון, הניהול והטיפול בהפרעות לב, ריאות ודם.

http://ghr.nlm.nih.gov/
Genetics Home Reference הוא אתר האינטרנט של הספרייה הלאומית לרפואה למידע לצרכנים על מצבים גנטיים והגנים או הכרומוזומים הקשורים למצבים אלה.

http://www.ncbi.nlm.nih.gov/books/NBK1116/
GeneReviews הם תיאורי מחלה שנכתבו על ידי מומחה, שנבדקו על ידי עמיתים, המוצגים בפורמט סטנדרטי ומתמקדים במידע רלוונטי מבחינה קלינית וניתן לפעולה רפואית על אבחון, ניהול וייעוץ גנטי של חולים ומשפחות עם מצבים תורשתיים ספציפיים.

הרשת האינטראקטיבית העולמית של איגוד האלצהיימר (GAAIN)

http://www.gaain.org/
ה-Global Alzheimer Association Interactive Network (GAAIN) הוא פרויקט שיתופי שיספק לחוקרים ברחבי העולם גישה למאגר עצום של נתונים מחקרי מחלת אלצהיימר ולכלים האנליטיים המתוחכמים וכוח החישוב הדרושים לעבודה עם הנתונים הללו. המטרה שלנו היא לשנות את הדרך שבה מדענים עובדים יחד כדי לענות על שאלות מפתח הקשורות להבנת הסיבות, האבחנה, הטיפול והמניעה של אלצהיימר ומחלות ניווניות אחרות.
בשנת 2013, השיג נתוני WGS עבור העוקבה הגדולה ביותר של 800 חולי אלצהיימר

קונסורציום הקוהורטים לחקר לב והזדקנות באפידמיולוגיה גנומית (CHARGE).

http://web.chargeconsortium.com/
קונסורציום ה-Cohorts for Heart and Aging Research in Genmic Epidemiology (CHARGE) הוקם כדי להקל על מטא-אנליזות של מחקרי אסוציאציות ברחבי הגנום והזדמנויות שכפול בין מספר מחקרי עוקבה אורכיים גדולים ובעלי פנוטיפ. יש להם גם נתוני מתילציה של DNA לצד WGS ו-Exome Seq.

מרכז NIMH למחקרים גנומיים שיתופיים על הפרעות נפשיות


תוצאות

פרופיל אפיגנומי מקיף הן בקווי BLCA והן בגידולים ראשוניים

בפרויקט זה, ביצענו RNA-Seq, ChIP-Seq עבור אצטילציה של Histon 3 lysine 27 (H3K27ac), Assay for Transposase-Accessible Chromatin באמצעות רצף (ATAC-Seq), וניסויי לכידת כרומטין לאישור כרומטין רחב (Hi-C) על 4 שורות תאי סרטן שלפוחית ​​השתן (איור 1a), אשר שניים מהם (RT4 ו-SW780) סומנו בעבר כ-luminal ושני האחרים (SCABER ו-HT1376) שאופיינו כבסיסיים [8, 25]. בהתבסס על נתוני ה-RNA-Seq שנוצרו במחקר זה, השתמשנו בגישת תת-טיפוס מולקולרית שדווחה בעבר [26] כדי לאשר את ההקצאה למצבי luminal ו-basal. התוצאות שלנו אישרו את RT4 ו-SW780 כשייכים לתת-הסוג לומינלי-פפילרי, בעוד ש-SCABER ו-HT1376 שייכים לתת-הסוג הבסיסי/קשקשי (קובץ נוסף 1: טבלה S1). לכל ניסוי בקווי תאי סרטן שלפוחית ​​השתן יש לפחות שני שכפולים ביולוגיים (קובץ נוסף 2: טבלה S2) וראינו מתאם גבוה בין שני המשכפלים (קובץ נוסף 3: טבלה S3). חשוב מכך, ביצענו את אותה קבוצת ניסויים גם על ארבעה גידולי שלפוחית ​​השתן החודרניים לשרירים של חולים. על ידי שימוש באותה שיטת תת-טיפוס מולקולרי, קבענו את תת-הסוגים שלהם כדלקמן: T1 הוא לומינלי-פפילרי, T3 הוא עשיר בסטרומה, ו-T4 ו-T5 הם בסיסיים/קשקשיים.

תתי-סוגי תעתיק BLCA לומינליים ובזאליים קשורים לפעילות של מקדם ומשפר דיסטלי מובהק ברמה האפיגנטית. א עיצוב כולל של המחקר. ב ניתוח של גן ביטוי דיפרנציאלי (DEG) של קווי תאים luminal (RT4 ו- SW780) וקווי תאים בסיסיים (SCABER ו-HT1376) מראה 427 גנים מווסתים ספציפיים לבסיס ו-524 גנים מווסתים ספציפיים ל-luminal. ג מפת חום של H3K27ac ChIP-Seq דיפרנציאלי במקדמים (משמאל). פרופילי עוצמת אות H3K27ac עבור כל אשכול של תאי BLCA (מימין). ד מעקב אחר אותות של דפדפן הגנום עבור פאנל של גנים לומינליים ובזאליים. מוצגים כאן המסלולים של נתוני H3K27ac ChIP-Seq, ATAC-Seq ו-RNA-Seq בתאי RT4, SW780, SCABER ו-HT1376. ה האמרגן H3K27ac ואותות ה-RNA-Seq המשויכים לו עבור גנים luminal ו-basal נבחרים מראים דמיון יוצא דופן. ו שיאי H3K27ac משולבים במשפרים דיסטליים ומודל אסוציאציה של ביטוי גנים של RNA-Seq מזהה משפרים משוערים וויסות גנים. 10,000 המשפרים המשתנים ביותר (מפת חום משמאל) מתווים יחד עם ביטוי הגנים המתאים להם (מפת חום ימנית). ז מתאמים של אותות H3K27ac רחבי הגנום בין שורות תאי סרטן שלפוחית ​​השתן ודגימות הגידול מדגימים דמיון לנוף המשפר

תתי-סוגי תעתוק BLCA לומינליים ובזאליים קשורים לפעילות מעודדת ומשפרת דיסטלית מובהקת ברמה האפיגנטית

העשרה של אותות H3K27ac שימשה כדי לחזות הן מקדמים פעילים והן משפרים דיסטליים [27, 28]. לכן, ביצענו לראשונה ChIP-Seq עבור H3K27ac בכל ארבעת סוגי התאים וארבע דגימות המטופלים. ראינו ששכפולים ביולוגיים בעקבות H3K27ac ChIP-seq תמיד מקובצים יחד, מה שמציין שהתוצאות שלנו ניתנות לשחזור (קובץ נוסף 4: איור S1A). יתר על כן, מצאנו כי שני תת-סוגים לומינליים (RT4 ו-SW780) התקבצו יחד, בעוד ששני קווי תאים בסיסיים (SCABER ו-HT1376) מקובצים יחדיו גם כן (קובץ נוסף 4: איור S1A). תוצאות מקבץ אלו מצביעות על פרופילים אפיגנומיים גלובליים משקפים במדויק את זהות התא. התקבצות ההיררכית בשורות התאים המבוססות על אותות H3K27ac השתקפה גם על ידי ביטוי mRNA גלובלי על ידי נתוני RNA-Seq (קובץ נוסף 4: איור S1B). ביצענו ניתוח ביטוי גנים דיפרנציאלי על שתי קבוצות סוגי התאים (RT4 ו-SW780 לעומת SCABER ו-HT1376) וזיהינו 427 גנים ספציפיים לבסיס (קובץ נוסף 5: טבלה S4) ו-524 גנים ספציפיים ל-luminal (איור 1b, קובץ נוסף 6: טבלה S5).

לאחר מכן, בדקנו שימוש בפרוטור בהתבסס על אותות H3K27ac בגנים ידועים. אישרנו שעוצמות האמרגן H3K27ac דומות להפליא לביטוי גנים (איור 1c), וניתוח מקבץ המבוסס על עוצמת האמרגן H3K27ac הצליח להבחין בין מודלים לומינליים ובזאליים של BLCA (קובץ נוסף 4: איור S1C). לדוגמה, צפינו שלשתי תת-סוגי BLCA תא BLCA RT4 ו-SW780 יש דפוסי H3K27ac דומים בגנים luminal FOXA1, GATA3, ו PPARG (איור 1d, ה), בעוד ששתי שורות התאים הבסיסיות חולקות סימני מקדם דומים בגנים המקודדים את הסמנים הבסיסיים/קשקשיים KRT5/14. מעניין, למרות שמבוסס על ביטוי גנים גלובלי, HT1376 מסווג כתת-סוג בסיסי/קשקשי, הוא מראה דפוס מקדם H3K27ac דומה בגנים לומינליים (GATA3, KRT7/8/18, איור 1ה).

פסגות H3K27ac דיסטליות מאזורי מקדם גנים שימשו כסמנים למשפרים פעילים [27, 29]. נקטנו באותה גישה כאן, ובממוצע, חזינו 59,466 (40,731-78,506) משפרים בכל שורת תאים (קובץ נוסף 7: טבלה S6). כדי לקשר את המשפרים הדיסטאליים לגני המטרה שלהם, ביצענו אסוציאציה מבוססת-מתאם של שיא-משפר דיסטלי-משפר כמתואר ב-[30] וזיהינו את 10,000 המשפרים הדיסטליים המשתנים המובילים שמראים מתאם משמעותי לגן המקושר שלו (מתאם ≥0.5, ע < 0.01 בסך הכל 58,509 עמדו בקריטריונים שלנו איור 1f וקובץ נוסף 8: טבלה S7). ראינו שהמשפרים מראים התקבצות ברורה בהתאם לסוגי תאים שונים, וגני המטרה שלהם מראים דפוסים דומים לסוג תא (איור 1f וקובץ נוסף 4: איור S1D). יתרה מכך, כדי להבין את הרלוונטיות הקלינית של הממצאים שלנו, ביצענו H3K27ac ChIP-Seq בארבע דגימות של חולי שלפוחית ​​השתן הפולשניים. התוצאות שלנו מראות מתאם יוצא דופן של שורות תאי גידול (איור 1g). לסיכום, אנו מראים בשורות תאים אלו ובקבוצת גידולים מוגבלת כי ויסות אפיגנטי נמצא בקורלציה עם הקצאת תת-סוג מולקולרי.

קבוצות מובחנות של מוטיבים של גורמי שעתוק מועשרים ב-BLCA-לומינלי ובזאלי הקשורים ל-BLCA cis אזורי ויסות DNA

ביצענו ATAC-Seq בשורות תאים RT4, SW780, SCABER ו-HT1376 כדי להעריך את מצב הכרומטין הפתוח שלהם בגנום. בממוצע, בכל שורת תאים, זיהינו 32,000 אזורי כרומטין פתוחים (איור 2א וקובץ נוסף 9: טבלה S8). ביניהם, 40.8% מאזורי הכרומטין הפתוחים היו ממוקמים באזורי פרומטור, בעוד 59.2% ממוקמים באזורים מרוחקים. בסך הכל, יותר מ-90% מאזורי מקדם הכרומטין הפתוחים חופפים ל-H3K27ac (קובץ נוסף 4: איור S2A, S2C-D). החפיפה של פסגות ATAC-Seq דיסטלי ו-H3K27ac נמוכה יותר (קובץ נוסף 4: איור S2A וקובץ נוסף 10: טבלה S9), לפחות חלקית בשל מספרים שונים של פסגות במערך נתונים שונים. מתאם כלל הגנום של ATAC-Seq הראה ש-HT1376 ו-SCABER התקבצו יחד עם 80% דמיון (קובץ נוסף 4: איור S2E) בהשוואה ל-RT4 luminal (

65%). ציינו כי תצפית זו מתאימה לאשכול מבוסס RNA-Seq ו-H3K27ac מבוסס אשכול (קובץ נוסף 4: איור S1A ו-B).

קבוצות מובחנות של מוטיבים של גורמי שעתוק מועשרים ב-BLCA-לומינלי ובזאלי הקשורים ל-BLCA cis אזורי ויסות DNA. א קבוצה מקיפה ומובחנת של אותות ATAC-Seq דיסטליים בשלושה אשכולות (ספציפיים לומינליים, ספציפיים בסיסיים ומשותפים) ואותות H3K27ac מתאימים. ב תוצאות ניתוח מוטיב TF מוצגות כאן כחלקה מדורגת (משמאל) ומוטיבים (מימין), כאשר משפרי כרומטין פתוחים (למטה) ספציפיים ל-luminal (למעלה) ומשפרי כרומטין פתוחים (למטה). ג כרומטינים פתוחים הקשורים ל-FOXA1 ו-GATA3 הממוקמים במשפרים דיסטליים של קו תאים RT4/luminal מתוארים כאן בשלוש קבוצות: FOXA1 בלבד, GATA3 בלבד ואתרי הקישור של FOXA1 ו-GATA3. ד ניתוח אונטולוגי גנים של מסלולים עבור כל קבוצה של אתרי קישור (FOXA1 בלבד, FOXA1 ו-GATA3 ו-GATA3 בלבד). ה התרחשות נצפתה של מוטיבים של TF (AP-1, FOX Forkhead ו-GATA) מוצגת כאן במשפרים ומקדמים דיסטליים של שלוש קבוצות. ו כרומטינים פתוחים לכל אורך הגנום של קווי תאים BLCA מראים דמיון עם גידולי TCGA שלפוחית ​​השתן [30]

לאחר מכן, ביצענו ניתוח מוטיבים של אזורי כרומטין פתוחים אלה (קובץ נוסף 11: טבלה S10). ראינו שאתרי קישור ל-CTCF ו-AP-1 קומפלקס מועשרים בכל שורות התאים (איור 2b וקובץ נוסף 4: איור S2G). דירוג נוסף של מוטיבים TF לפי העשרה עערך חשף אזורי כרומטין פתוחים לומינליים (המשותפים בין RT4 ל-SW780) הועשרו במוטיבים מחייבים עבור GRHL2, TP53 ו-TP63 בעוד כרומטינים פתוחים בסיסיים (המשותפים בין SCABER ו-HT1376) הועשרו עבור TEAD1/4 ו-KLF2 גורם (איור. ) מוטיבים מחייבים. בעבר דווח על GRHL2 [31] כגן לומינלי, ובכך אימת את הממצאים שלנו. באופן מעניין, מוטיבים מחייבים עבור חלבונים מורכבים AP-1 FOSL1/2, JUN/JUNB, ATF3 ו-BATF TFs [32] היו המוטיבים המועשרים ביותר עבור כרומטינים פתוחים luminal ו-basal-squamous כאחד. לאחר מכן מיפינו באופן מקיף את כל מוטיבים ה-TF המועשרים בכרומטינים פתוחים luminal, basal-squamous ומשותפים של משפרים דיסטליים כדי לבחון את הקשר בין TFs ותתי-סוגים BLCA (קובץ נוסף 11: טבלה S10). גילינו שבמשפרים דיסטליים, תת-הסוגים הלומינליים של BLCA קשורים ל-TFs של קולטני הורמון סטרואידים שדווחו בעבר. מצד שני, אזורי כרומטין פתוחים בזאלי-קשקשי במשפרים מראים העשרה של גורמים שלא דווחו בעבר MADS box TF MEF2C וה-homeobox TF OTX2. באופן לא מפתיע, TFs חלוצי luminal כגון גורמי שעתוק של המזלג (FOXA1/2/3, FOXF1, FOXK1, FOXM1), ו-GATA TFs (GATA3/4/6) הועשרו במשפרים הקשורים ל-luminal עם קונפורמציה פתוחה של כרומטין. באופן מפתיע יותר, מוטיבים של מזלג ו-GATA זוהו גם כקשורים לכרומטין פתוח באלמנטים משפרים על פני קווי תאים (קובץ נוסף 11: טבלה S10). בעוד ש-FOXA1 ו-GATA3 ידועים כבעלי ביטוי נמוך בקווי תאי סרטן שלפוחית ​​השתן הבסיסיים ובגידולים, ההעשרה של מוטיבים של המזלג וה-GATA בכרומטינים פתוחים על פני קווי תאים BLCA מרמזת על פיצוי על ידי גורמי Forkhead ו-GATA מלבד FOXA1 ו-GATA3. בנוסף, העשרת מוטיב של Forkhead ו-GATA על פני קווי תאים באזורים של כרומטין פתוח עשויה להצביע על TFs ספציפיים ללומינלים מוכנים להיקשר לאזורים אלה של כרומטין פתוח. יתר על כן, ידוע כי FOXA1 ו- GATA3 ממלאים תפקיד בפיתוח של urothelium [31], דבר המצביע על כך שאתרי הקישור שלהם עשויים להיות מודרכים מוקדם במהלך הפיתוח. גילינו גם שה-TFs החלוציים הקשורים לתאי גזע כמו גורמי KLF (KLF10/14), גורמי ATF (ATF1/2/4/7) ו-NANOG היו מועשרים במשפרי בסיס הקשורים לבסיס. זה מעניין מכיוון שקיימת אוכלוסיית תאי אבות בתוך האורותל הבסיסי שיכולה לתרום להתפתחות והתמיינות של אורותל [33, 34].

FOXA1 ו-GATA3 נקשרים בכרומטינים פתוחים luminal במשפרי דיסטלי רגולטוריים כדי להניע ביטוי של גנים ספציפיים ל-luminal

שיערנו ש-TFs כגון FOXA1 ו- GATA3 נקשרים באזור הכרומטין הפתוח לחלוצי משפרי luminal ומפעילים ביטוי גנים קשור. כדי לבדוק השערה זו, ביצענו את GATA3 ChIP-Seq בקו התאים RT4 luminal BLCA והשגנו FOXA1 ChIP-Seq בתאי RT4 מהעבודה שפורסמה בעבר (קובץ נוסף 12: טבלה S11) [8]. כפי שצפוי, TFs luminal FOXA1 ו- GATA3 הראו קישור מועשר בלוקוסי הכרומטין הפתוחים של luminal-associated (FOXA1, GATA3, PPARG, FGFR3, ו FABP4) משפרים דיסטליים (איור 2c). ליתר דיוק, גילינו 1325 משפרים דיסטליים שמראים חיבור משותף של FOXA1 ו- GATA3 ב-RT4 (איור 2c). באופן דומה, FOXA1 ו- GATA3 הראו קישור מועשר בלוקוסי כרומטין פתוחים של גנים של סמן luminal (FOXA1, ERBB3, KRT19, GPX2, ו FABP4) מקדמים (קובץ נוסף 4: איור S2F).

ניתוח מונחי GO של גנים קרובים לאתרי המשפרים הדיסטאליים הללו הראה ויסות של ייצור TGF בטא, התפתחות אפיתל, ויסות של שעתוק המעורב במחויבות לגורל התא, ותהליכים ביולוגיים של היצמדות תא-תא (קישור קדרין והרכבת צומת דבקים) כמונחים הקשורים ל-FOXA1 . בנוסף, ויסות של רכיב תאי, גודל תא ותהליכים ביולוגיים של קרום פלזמה אפיקלית היו מונחים שזוהו עם גנים הקשורים ל-GATA3 פרוקסימליים למשפרים דיסטליים אלה, דבר המצביע על מעורבות חזקה של שני ה-TFs במחויבות לגורל התא ולהתמיינות הלומינלית (איור 2d) ). בהתייחס לגנים פרוקסימליים הקשורים למשפרים דיסטליים הקשורים הן ל-FOXA1 והן ל-GATA3, מונחים שזוהו היו קשורים לתהליכי התפתחות שונים ולוויסות הפרשת ריר והתמיינות תאי שומן, שתיהן תכונות מטבוליות חשובות של אורותל מובחן (איור 2ד).

לאחר מכן המשכנו בניתוח המוטיב של FOXA1 בלבד, GATA3 בלבד, ואתרים קשורים יחד. באופן מפתיע, קומפלקסים של AP1 הועשרו במיוחד בכל המשפרים הדיסטליים בנוסף למוטיבים של FOXA או GATA (איור 2ה). יש לחקור את סדר הקישור של שלושת הגורמים הללו. לבסוף, כדי להבין את הרלוונטיות הקלינית של הממצאים שלנו, השווינו את ארבעת קווי תאים BLCA שלנו לנתוני ATAC-Seq של גידולי שלפוחית ​​השתן החודרניים לשריר TCGA [30] וגילינו שפרופיל הכרומטין הפתוח לכל הגנום בשורות התאים שלנו מקובץ עם מקבצים שונים של גידולים (איור 2f), מה שמצביע על כך שאזורי הכרומטין הפתוחים בשורות תאים אלה חולקים דפוסים דומים עם גידולי חולה.

תת-סוגים לומינאליים ובזאליים של BLCA מראים ארגוני גנום תלת-ממדיים שונים

מחקרים קודמים הראו שארגון כרומטין תלת מימדי קשור להפעלה אפיגנטית או השתקה של גנים בתאים [35]. לדוגמה, ידוע שרוב ההטרוכרומטין נדחס בגרעינים וממוקם ליד הפריפריה הקשורה ללמינה של המעטפת הגרעינית [35]. כדי לקבל תובנות ראשוניות על הנוף התלת-ממדי הכולל הגנום של BLCA luminal ו-basal, ביצענו ניסויי Hi-C ברזולוציה גבוהה בכל ארבעת שורות התאים (לפחות 800 מיליון קריאות, כל אחד) וחמישה חולי גידול בשלפוחית ​​השתן (> 800 מיליון קריאות , כל אחד) (קובץ נוסף 4: איור S3). השתמשנו בתוכנה שפותחה לאחרונה, Peakachu [36], שהיא גישת זיהוי לולאות כרומטין מבוססת למידת מכונה, כדי לחזות לולאות ברזולוציית bin של 10Kb. ראשית, זיהינו ממוצע של 56,315 לולאות (טווח בין 38,271 ל-69,032) בארבע שורות התאים (הסתברות 0.8 קובץ נוסף 13: טבלה S12). לאחר מכן, על ידי שימוש בפלט ציון ההסתברות מ- Peakachu, הקצנו לולאות כרומטין ספציפיות לתת-סוג כפי שמוצג בניתוח שיא המצטבר (APA, איור 3a וקובץ נוסף 14: טבלה S13) [37]. בהתבסס על הגישה שלנו, צפינו בלולאות פוטנציאליות ספציפיות ל-luminal ב-RT4 ו-SW780 (2299) ביחס למודלים הבסיסיים של BLCA SCABER ו-HT1376 (2144). לאחר מכן השווינו כל אחת מהקטגוריות הללו עם לולאות שזוהו בחמש דגימות של מטופלים (איור 3b):

30-40% מלולאות כרומטין תלת-ממדיות שהוקצו לומינלי ובסיסי שזוהו בשורות התאים נצפו בחמש דגימות הגידול הללו.

תת-סוגים לומינאליים ובזאליים של סרטן שלפוחית ​​השתן מראים ארגונים גנום תלת מימדיים שונים. א ניתוח לולאות Hi-C של קווי תאים luminal ו-basal-squamous מציגים לולאות לומינליות ברורות ולולאות קשקשיות בזאליות. ב אנשי קשר שזוהו בקווי תאים luminal ו-basal-squamous משותפים ומאומתים בחמש דגימות גידול סרטן שלפוחית ​​השתן. ג מסלולי דפדפן גנום עבור גן לומינלי נבחר (FOXA1) וגן בסיסי (KRT5) המכילים לולאות מקדם-משפר מוצגים כאן. קשתות מציינות את לולאות הכרומטין החזויות באמצעות נתוני Hi-C. ד מוצג סוג אנשי הקשר המבוסס על חפיפה של מיקום המגע בכל קו תאים (H3K27ac באזור דיסטלי) או פרומטור (H3K27ac ו-H3K4me3 בפרוטור). E-P, מקדם-מקדם לולאות E-E, משפר-משפר לולאות P-P, מקדם-מקדם לולאות E-N, משפר-ללא רגולטוריות P-N, מקדם-ללא רגולטוריות אין, לולאות לא-רגולטוריות. ה העשרה של אתרי קישור FOXA1 (ציר שמאל) ו-GATA3 (ציר ימין) בתאי RT4 (luminal) מוצגת כאן בעוגני הלולאה שלו

לבסוף, בדקנו לולאות משפר ומקדם בכל קטגוריה על הקשר שלהן עם ביטוי גנים ספציפי תת-סוג. דוגמאות מוצגות באיור 3c, שבה מצאנו שהגן הלומינלי FOXA1 והגן הבסיסי KRT5 הראה מספר מוגבר של לולאות משפר-מקדם בשורות תא luminal ו-basal, בהתאמה. בסך הכל, ראינו את זה

40% מלולאות הכרומטין קיימות בין משפרים ומקדמים (איור 3ד). יתר על כן, מצאנו העשרה משמעותית של אתרי הקישור של FOXA1 ו-GATA3 בעוגני הלולאה הללו, מה שמעיד על מעורבותם של גורמים חלוצים אלה בוויסות הגנום התלת-ממדי (איור 3ה). ממצא זה עולה בקנה אחד עם מחקרים קודמים שדיווחו על העשרה של אתרי קשירה של FOXA1 בלולאות משפר-מקדם [38].

וריאציה במספר העתק (CNV) ולולאות כרומטין בסרטן שלפוחית ​​השתן

סימן ההיכר של הסרטן הוא שינויים מבניים גדולים (SVs), הכוללים היפוכים, מחיקות, כפילויות וטרנסלוקציות. לאחרונה, הוכח ששינוי ב-CNVs ו-SVs יכול להוביל לשינויים במבנה הגנום התלת-ממדי, כולל היווצרות של תחומים חדשים הקשורים טופולוגית ("ניאו-TADs") [39] וכתוצאה מכך "חטיפת משפר [40]". Neo-TADs מתייחסים לתרחישים שבהם אירוע SV מוביל ליצירת תחומי כרומטין חדשים, אשר יכולים בתורו להשפיע על פרופילי הביטוי של הגנים הממוקמים באזורים אלה. במודל ה"משפר-חטיפה", ארגון הגנום התלת-ממדי גורם לאינטראקציה לא תקינה של משפרים, כאשר משפרים מובאים בסמיכות לגן המטרה הלא נכון (בדרך כלל אונקוגן) וכתוצאה מכך הפעלת מטרה לא מתאימה.

תחילה זיהינו באופן שיטתי וריאציות של מספר העתקות (CNVs) ואירועי SV באמצעות נתוני Hi-C עם HiNT [41] ותוכנת Hi-Cbreakfinder [42]. זיהינו עשרות SVs גדולים, כולל היפוכים, מחיקות וטרנסלוקציות (איור 4a, ב, קובץ נוסף 4: איורים S4-S5, קובץ נוסף 15: טבלה 14). כפי שניתן לצפות, ראינו פחות CNVs בדגימות המטופלים מאשר בשורות תאים. חשוב מכך, הצלחנו לבנות מחדש את מפת ה-Hi-C המקומית המקיפה את נקודות השבירה של ה-SVs. אנו יכולים לצפות באירועי חטיפת משפר מעניינים והיווצרות ניאו-TADs במפות Hi-C מקומיות אלה (איור 4c-h). These observations provide an important resource to further study the function of the re-arranged enhancers in the context of bladder cancer.

Chromatin interactions induced by structure variation (SV) events. א, ב Circos plot showing intra- and inter-chromosome SVs in SCABER (א) and SW780 (ב). ג A large intra-chromosomal translocation on chr9. דח Inter-chromosomal translocations. The breakpoints were identified by the HiCBreakfinder software. We then reconstructed the local Hi-C maps across the breakpoints. RNA-Seq and H3K27ac ChIP-Seq tracks from the same cell type are shown below the Hi-C maps

Neuronal PAS Domain Protein 2 (NPAS2) is a novel luminal BLCA TF which regulates luminal gene expression and cell migration

Genome-wide open chromatin analysis of BLCA cell lines provides an ideal platform for the identification of novel transcriptional regulators of BLCA cell fate and phenotype. Here we performed motif analysis of luminal-associated, basal-associated, and shared open chromatin regions, resulting in the identification of distinct TFs in each cluster. Among them, many represent known families of subtype-specific regulators, such as the GATA, FOX, and ETS families at luminal-associated ATAC-Seq peaks. Among them, we noticed a potential novel bHLH containing regulator, NPAS2, which is enriched in the luminal-associated and shared clusters, but not enriched in basal-associated ATAC-Seq peaks (Fig. 5a). We examined its binding profile using the latest ENCODE data (HEPG2 cells) [43] and found that NPAS2 binds at the FOXA1 promoter region (Fig. 5b), but not at regulatory regions for basal marker genes. This suggests the possibility that NPAS2 may be an upstream regulator of FOXA1. We then checked the TCGA data and found that high expression level of NPAS2 is significantly correlated to overall patient survival (Fig. 5c).

NPAS2 is a novel bladder cancer regulator. א ע-values of NPAS2 motif in luminal-associated (RT4, SW780), basal-associated (SCABER, HT1376), and shared open chromatin regions. ב NPAS2 ChIP-seq signal near luminal marker genes FOXA1, GATA3, ו PPARG in HEPG2 cell line. ג NPAS2 Kaplan-Meier curve is shown here for 2000 days with log-rank statistics and hazards ratio. ד Transwell migration assay representative crystal violet staining (left) and quantification of differences in transwell migration (right) are shown following overexpression of NPAS2 in SCABER. ה RT-qPCR results for basal marker genes KRT5, KRT6A, STAT3, ו TFAP2C are shown here for wild-type and NPAS2 overexpressed SCABER basal cell line. ו NPAS2, FOXA1/GATA3, ו PPARG RT-qPCR are shown here for wildtype and FOXA1/GATA3 overexpressed SCABER basal cell line

To further determine whether NPAS2 expression influences the downstream target expression and phenotype, we overexpressed NPAS2 in the basal-squamous BLCA cell line SCABER. First, we performed trans-well migration assays and found that overexpression of NPAS2 in SCABER cells decreased cell trans-well migration (Fig. 5d). We then performed RT-qPCR experiments and found that the basal marker genes (such as KRT5, KRT6A, ו TFAP2C) are significantly downregulated (Fig. 5e) following NPAS2 overexpression, suggesting NPAS2 represses the expression of a subset of basal marker genes.

Because our functional genomics analysis suggests that FOXA1 and GATA3 cooperate to regulate luminal target genes [8], we individually overexpressed FOXA1 and GATA3 in SCABER cells to test their ability to regulate NPAS2 expression. We observed increased expression of NPAS2 by both FOXA1 and GATA3 overexpression (Fig. 5f).


Discussions

Advances in single-cell technologies present new challenges and opportunities for making biological discovery. Single-cell studies often involve large numbers of cells, which are powerful at characterizing cellular heterogeneity, but small numbers of biological samples, which are underpowered for discovering common disease genes. It has been shown by recent genome-wide association analysis that it is possible to enable new discovery by performing association analysis at cell-type resolutions [55]. For cancer and genetic diseases driven by somatic mutations, being able to obtain genetic footprint at various time and conditions can enable discovery of genes responsible for disease progression and resistance to therapy.

However, it remains unclear what analytical strategies should be deployed to achieve the benefits. Even more challenging it gets when CNAs are being considered, as CNAs affect large regions of the genome and are difficult to trace using phylogenetics methods.

In our study, we demonstrated that it is possible to achieve the benefit by reconstructing copy number evolution history as a lineage tree, i.e., MEDALT, and performing permutation-based statistical analysis, i.e., LSA, to identify fitness-associated CNAs and genes.

We have learned several important lessons in our study.

First, it is important to perform accurate lineage tracing. Although the single-copy gain and loss model that we implemented in deriving MEDALTs is limited in complexity, it already performed substantially better than conventional phylogenetics algorithms such as MP that assumes infinite sites and NJ that employs naïve distance metrics, as shown in our simulation and in real data analysis. It is conceivable that further development of methodology that incorporates more complex genome evolution mechanisms such as chromothripsis [56] can lead to better results.

An important goal was to represent convergent evolution that is likely prevalent in the lens of CNAs [10, 57]. Conventional phylogenetics algorithms strictly prohibit the expression of convergent evolution by disallowing an alteration to occur multiple times in a course of evolution [28]. Several new algorithms relaxed such limitation but were designed for analyzing point mutation data [58]. As shown in our analysis of the TNBC patients, genes identified based on convergent evolution analysis (i.e., PLSA) had an even higher fraction of known cancer genes than those identified based on cohort-level single-lineage LSA. Our result suggests that examining convergent evolution is likely a key component towards fully unleashing the power of single-cell studies.

Unlike canonical phylogenetic trees, MEDALTs are minimal spanning trees that do not contain unobserved internal ancestral nodes. Representing evolution using minimal spanning trees instead of phylogenetics trees was our deliberate choice, as it allowed us to develop polynomial-runtime solutions that are scalable to real datasets containing thousands of cells. It also allowed us to conveniently implement biologically meaningful MED and enforce directionality constraints. Phylogenetics algorithms are likely effective when the numbers of cells are small and that the alterations are simple to trace. None of these conditions apply to available SCCN datasets that have CNAs evolving non-linearly in hundreds of cells. Moreover, we have shown in our simulation that for the purpose of detecting fitness-association alterations, our method outperformed phylogenetics approaches in a wide range of sample sizes.

A particular challenge in developing and evaluating computational lineage tracing methods is the lack of exact ground truth. Although various experimental technologies have been developed [59, 60], we are not aware of any that can be applied to trace copy number evolution in patient samples. To circumvent this, we utilized in silico simulation that mimics several prevalent CNA mechanisms to evaluate the accuracies of the reconstructed lineages and fitness-associated alterations. We also utilized longitudinal datasets on which we knew the biological stages of the cells to evaluate the chronological accuracy of the inference results. Although these strategies are unlikely sufficient to validate all the edges and lengths in the trees, they are objective and sufficient to discriminate various approaches.

Second, it is important to control biases in statistical inference. It is challenging to detect fitness-associated genes, as CNAs often affect a large number of genes and that the sample sizes are often small. Passenger CNAs that occur naturally in non-functional regions such as those near fragile sites or repeats could easily cloud the discovery. In addition, lineage tracing algorithms are unlikely to be perfect and could introduce distinct biases. To address these challenges, we employed LSA, which randomly permutes SCCN profiles into different cells to reduce the biases introduced by background genomic variations and technical noises. And we reconstructed trees from permutated datasets to alleviate biases introduced by the lineage tracing algorithms. The evolutionarily meaningful MED metrics and constraints help our analyses to focus on biologically relevant hypotheses, given limited computational resources. These procedures appeared important to achieve the accuracy. Further exploration of different ways to permute the data and to estimate the background distribution will likely lead to better results.

We assessed the functional impact of the identified genes using cell-line CRISPR essentiality screen data. We confirmed that the set of fitness-associated, amplified genes discovered by our methods are significantly more essential than other control gene sets in cancer cell lines. We also nominated novel genes that appear to have prognostic values in TCGA and the METABRIC datasets. These assessment strategies likely have false positives and negatives. Further comprehensive, well-controlled and targeted experiments will likely be required to fully assess the functional impact and clinical values of these genes.

Lastly, it was exciting to observe benefits of our methods on both the scDNA-seq and the scRNA-seq data. Although RNA-derived copy number profiles may not be as accurate as those derived from DNAs, previous studies [61] suggested that they can reasonably distinguish tumor clones. Our study further revealed the value of scRNA-seq data in lineage tracing and supported the notion that genomic profiles, even approximations, are more accurate than transcriptomic profiles in determining biological timing of cells. Our results opened doors towards utilizing scRNA-seq as a platform to understand genetics underlying developmental processes and perform gene discovery.


סיכום

The number of users proves that MEXPRESS, through its ease of use and unique, integrative data overview, found its place in the toolbox of many researchers. By combining a comprehensive visualization and statistical analysis in a single figure, MEXPRESS helps researchers quickly identify dysregulations and their clinical relevance in cancer. With this major, feedback-driven update, we aim to consolidate MEXPRESS’s place in the set of open source web tools available to researchers and clinicians.


שיטות

Haploproficient genes and orthology analysis

The set of S.cerevisiae genes which are haploproficient in turbidostat culture was obtained using the growth data of [8] and an FDR cutoff of 0.02. This stringent FDR cut-off rigorously defines those genes for which heterozygosity confers a strong fitness advantage, but has no effect on the functional enrichment of genes identified as haploproficient. Genes defined as ‘haploproficient’ for the purposes of this study are listed in Additional file 1: Table S1. The set of chromosome maintenance-associated HP genes described in [8] overlaps, but is not coincident, with the HPGI set studied here, since the current set also includes DNA damage-response genes.

Orthology assignments were made using the InParanoid algorithm [50] and compared with the results of a BLAST [51] reciprocal best-hits search. GO enrichment searches were performed using the Babelomics 4 FatiGO tool [52]. To assess the significance of HP gene conservation, the number of HP genes having orthologs in a given Ascomycete species, given the number of S. cerevisiae HP genes, was compared against the whole-genome conserved proportion using a χ 2 or Fisher exact test (depending on sample size), with the null hypothesis of identical distribution. All findings of significance were reiterated using a Z test for difference of proportions. Where necessary, פ values were corrected for multiple testing using the Bonferroni correction. Cell cycle and DNA damage repair pathways were obtained from the KEGG pathway database [53].

Expression data for S.cerevisae genes was obtained from the Saccharomyces Genome Database [54] and protein expression levels from [55]. A list of human cancer genes/oncogenes was obtained from the Cancer Gene Index [17] enrichment of HP genes amongst the orthologs was determined using a χ 2 test as above. CNV incidence across eight tumour types (breast invasive carcinoma, rectum adencarcinoma colon adenocarcinoma, kidney renal cell clear carcinoma, uterine corpus endometrioid carcinoma, glioblastoma multiforme, acute myeloid leukemia, lung adenocarcinoma, lung squamous cell carcinoma, serous cystadenocarcinoma) as measured by comparative genomic hybridisation, was obtained from the NCI Cancer Genome Atlas online data browser [17] with a copy number (log2 ratio) of magnitude >0.5 taken as the significance threshold. Details of the sampling and analysis of the tumour samples are described in [17]. א P-value for HP ortholog overrepresentation was calculated using a χ 2 test .The TGCA database was also used to perform a pathway search for overrepresentation of HP orthologs.

Yeast strains

In total, 30 HP genes were chosen for analysis, based upon the criteria discussed in the Results above. The heterozygous deletion mutant of each gene was obtained from the heterozygous diploid deletion library (Open Biosystems), in the BY4743 (מַחצֶלֶת א /α, his3D1/his3D1, leu2D0/leu2D0, LYS2/lys2D0, met15D0/MET15, ura3D0/ura3D0) genetic background. For non-essential genes, the homozygous deletant was retrieved from the analogous homozygous diploid deletion library (Open Biosystems).

Control strains were the BY4743 WT, along with the heterozygous deletion mutant of the non-functional his3 locus the non-HP, non-cell cycle הו/הו heterozygous deletion strain and the heterozygous deletion mutant of the non-HP, cell cycle gene HSL1. In addition, heterozygous deletion mutants of the G1 and G2 cyclins were included in several of the experiments. A complete list of the strains used is provided in Additional file 6: Table S6.

Cell-cycle profiling

Flow cytometric analysis of the deletion strains’ cell cycle profiles was carried about following the method of [56]. בקצרה,

10 7 cells in mid-exponential phase were harvested, washed, and fixed in absolute ethanol at 4C overnight. Fixed cells were then collected, washed, and boiled for 15 minutes in 2 mg/mL RNAse in 50 mM Tris-Cl (pH 8), and incubated at 37C for 2–12 hours. Cells were resuspended in protease solution (5 mg/mL pepsin, 4.5 μL/mL concentrated HCl), incubated for 15 minutes at 37C and resuspended in 50 mM Tris (pH 7.5). For analysis, 50 mL of cell suspension was added to 1 mL of 1 mM Sytox Green in 50 mM Tris pH 7.5), vortexed and analysed using a Cyan flow cytometer (Beckman Coulter). FlowJo (Tree Star) analysis software was used to fit histograms to the peaks representing 1C and 2C DNA content, and thereby calculate the number of cells in the G1 and G2 phases, and infer the number in S phase from the remaining fraction of the population.

Chronological lifespan assay

Cultures were inoculated from frozen stocks, grown overnight in YPD at 3°C, and 200mL of each was transferred into a well of a 96-well microtiter plate (Corning). Strains were present in duplicate on each plate, with a buffer of WT in the wells around the edge of the plate, so edge effects would not impact test colony measurements. A Singer Rotor HDA colony pinning robot was used to spot four replicates of each well onto a YPD + 10 μg/mL phloxine B (Sigma) plate. Phloxine B is a fluorescein derivative taken up when the cell membrane is disrupted upon cell death [57]. Plates were incubated for 48 hours at 3°C and photographed using an Epson 1240 Scanner. The colony images were analysed using a custom image-analysis code written in MatLab, with colony size measured by pixel count, and fraction of dead cells by the intensity of colony redness [10]. Since these parameters are independent, this allowed the dissection of the effect of cell viability upon colony growth from that of growth rate variation. The 96-well liquid cultures were incubated at 3°C, and, every second day over a period of three weeks, the colony-pinning onto YPD + phloxine B and image analysis repeated. For each plate, the median culture intensity for each strain was compared with the growth of the WT on that plate, and also with the strain growth and viability after the initial 48-hour period. The experiment was performed twice.

At several points throughout the 3-week period, several strains were selected at random, and viability assayed by performing serial dilutions and counting colony-forming units. These results were checked for compatibility with the microplate viability results.

Apoptosis assays

The rate of occurrence of apoptosis in the different strain populations was measured in two ways. Apoptosis was first induced by pretreating cells with 0.001%, 0.01% MMS, 0.0001% or 0.001% TBHP in overnight culture keeping a negative, non-induced WT control sample.

The translocation of phosphatidyl serine to the cell surface, a marker of apoptosis [58], was measured using an Annexin V-FITC Apoptosis Detection kit. (Sigma). Cells were harvested, washed in 1.2M sorbitol, 0.5 mM MgCl2, 35 mM K phosphate (pH 6.8) and then digested in 5.5% glusulase (Sigma) and 15 U/mL lyticase (Sigma) for 2 hours at 28C. Spheroplasts were harvested, washed in binding buffer (10 mM Hepes/NaOH pH 7.4, 140 mM NaCl, 2.5 mM CaCl2 in 1.2 M sorbitol buffer) and resuspended in binding buffer/sorbitol. 5 mL of FITC-labelled annexin V, and 10 mL of 10010 mg/mL propidium iodide were added to each sample, with control samples containing 1.) no label, 2.) FITC-annexin V only, and 3.) PI only. Fluorescence was quantified using a CyAn (Beckman Coulter). Gates were fitted on the basis of the the control samples, dividing a log PI versus log FITC plot into four quadrants: lower left (neither FITC nor PI-stained) – viable cells upper left (PI stain only) – necrotic cells lower right (FITC only) – early apoptotic cells and upper right (PI and FITC-stained) – late apoptotic cells. FlowJo software (TreeStar) was used to count the fraction of the total cell population in each quadrant. The proportion of both necrotic and apoptotic cells for each strain was normalised to strain viability (i.e. on the basis of the proportion of cells assigned to the lower-left FITC/PI quadrant), and the ratio of necrotic:apoptotic cells calculated. Ratios for each strain were normalised to the WT value, and the standard deviation across all samples calculated. Strains having a necrosis:apoptosis ratio further than 1.5x this standard deviation from WT levels were deemed to demonstrate abnormal apoptosis rates.

Growth rate and drug sensitivity assays

Growth and drug sensitivity assays were performed both on solid media and in liquid cultures. For solid assays, the required drug concentration was added to YPD-agar containing 10μg/m/mL phloxine B. Overnight cultures of the strains were spotted onto the (drug-containing) plates using a Singer rotor, as above. Plates were incubated at 3°C and photographed at 24 and 48 hours and analysed using an image-processing code as described above. Strain growth and viability was compared both with WT growth on the same plate, and with growth on YPD-agar (or YPD-agar plus DMSO, where the drug is DMSO-soluble). The ratio of viability and size with and without drug was calculated for every strain on a plate, and the standard deviation of all ratios calculated. Strains having a drug:untreated ratio greater than or less than two standard deviations from that of the WT were deemed to be resistant and sensitive, respectively.

Assays in liquid culture were performed by transferring 5mL of overnight culture into each well of a 96-well microtitre plate, containing 200 μL of YPD plus the required concentration of drug. Absorbance was measured for 30 hours at 3°C using a BMG Optima platereader, maximum growth rate calculated using a curve-fitting script written in R, and the growth rate for each strain compared with that of the WT in the same plate, and growth in YPD/YPD + DMSO.


הפניות

Yi K, Ju Y. Patterns and mechanisms of structural variations in human cancer. Exp Mol Med. 201850:98.

Yang L, Luquette L, Gehlenborg N, Xi R, Haseley P, Hsieh C, Zhang C, Ren X, Protopopov A, Chin L, et al. Diverse mechanisms of somatic structural variations in human cancer genomes. תָא. 2013153:919–29.

Zhang Y, Yang L, Kucherlapati M, Chen F, Hadjipanayis A, Pantazi A, Bristow C, Lee E, Mahadeshwar H, Tang J, et al. A pan-cancer compendium of genes deregulated by somatic genomic rearrangement across more than 1,400 cases. Cell Rep. 201824:515–27.

Campbell P, Getz G, Stuart J, Korbel J, Stein L. Pan-cancer analysis of whole genomes. Preprint at. 2017. https://doi.org/10.1101/162784.

Zhang Y, Chen F, Fonseca N, He Y, Fujita M, Nakagawa H, Zhang Z, Brazma A, Creighton C. Whole genome and RNA sequencing of 1,220 cancers reveals hundreds of genes deregulated by rearrangement of cis-regulatory elements. Preprint at. 2017. https://doi.org/10.1101/099861.

Deaton A, Bird A. CpG islands and the regulation of transcription. Genes Dev. 201125:1010–22.

Bird A. DNA methylation patterns and epigenetic memory. Genes Dev. 200216:6–21.

Pfeifer G. Defining driver DNA methylation changes in human cancer. Int J Mol Sci. 201819:E1166.

Morano A, Angrisano T, Russo G, Landi R, Pezone A, Bartollino S, Zuchegna C, Babbio F, Bonapace I, Allen B, et al. Targeted DNA methylation by homology-directed repair in mammalian cells. Transcription reshapes methylation on the repaired gene. Nucleic Acids Res. 201442:804–21.

Russo G, Landi R, Pezone A, Morano A, Zuchegna C, Romano A, Muller M, Gottesman M, Porcellini A, Avvedimento E. DNA damage and repair modify DNA methylation and chromatin domain of the targeted locus: mechanism of allele methylation polymorphism. Sci Rep. 20166:33222.

Allen B, Pezone A, Porcellini A, Muller M, Masternak M. Non-homologous end joining induced alterations in DNA methylation: a source of permanent epigenetic change. Oncotarget. 20178:40359–72.

Sun W, Bunn P, Jin C, Little P, Zhabotynsky V, Perou C, Hayes D, Chen M, Lin D. The association between copy number aberration, DNA methylation and gene expression in tumor samples. Nucleic Acids Res. 201846:3009–18.

Davis C, Ricketts C, Wang M, Yang L, Cherniack A, Shen H, Buhay C, Kang H, Kim S, Fahey C, et al. The somatic genomic landscape of chromophobe renal cell carcinoma. Cancer Cell. 201426:319–30.

Forbes S, Beare D, Boutselakis H, Bamford S, Bindal N, Tate J, Cole C, Ward S, Dawson E, Ponting L, et al. COSMIC: somatic cancer genetics at high-resolution. Nucleic Acids Res. 201745:D777–83.

Lawrence M, Stojanov P, Mermel C, Robinson J, Garraway L, Golub T, Meyerson M, Gabriel S, Lander E, Getz G. Discovery and saturation analysis of cancer genes across 21 tumour types. טֶבַע. 2014505:495–501.

Chen F, Zhang Y, Gibbons D, Deneen B, Kwiatkowski D, Ittmann M, Creighton C. Pan-cancer molecular classes transcending tumor lineage across 32 cancer types, multiple data platforms, and over 10,000 cases. Clin Cancer Res. 201824:2182–93.

Storey JD, Tibshirani R. Statistical significance for genomewide studies. Proc Natl Acad Sci U S A. 2003100:9440–5.

Hu X, Wang Q, Tang M, Barthel F, Amin S, Yoshihara K, Lang F, Martinez-Ledesma E, Lee S, Zheng S, Verhaak R. TumorFusions: an integrative resource for cancer-associated transcript fusions. Nucleic Acids Res. 201846:D1144–9.

Peifer M, Hertwig F, Roels F, Dreidax D, Gartlgruber M, Menon R, Krämer A, Roncaioli J, Sand F, Heuckmann J, et al. Telomerase activation by genomic rearrangements in high-risk neuroblastoma. טֶבַע. 2015526:700–4.

Creighton C, Hernandez-Herrera A, Jacobsen A, Levine D, Mankoo P, Schultz N, Du Y, Zhang Y, Larsson E, Sheridan R, et al. Integrated analyses of microRNAs demonstrate their widespread influence on gene expression in high-grade serous ovarian carcinoma. PLoS ONE. 20127:e34546.

Ungewiss C, Rizvi Z, Roybal J, Peng D, Gold K, Shin D, Creighton C, Gibbons D. The microRNA-200/Zeb1 axis regulates ECM-dependent β1-integrin/FAK signaling, cancer cell invasion and metastasis through CRKL. Sci Rep. 20166:18652.

Kiuru-Kuhlefelt S, Sarlomo-Rikala M, Larramendy M, Söderlund M, Hedman K, Miettinen M, Knuutila S. FGF4 and INT2 oncogenes are amplified and expressed in Kaposi’s sarcoma. מוד פאתול. 200013:433–7.

Weischenfeldt J, Dubash T, Drainas A, Mardin B, Chen Y, Stütz A, Waszak S, Bosco G, Halvorsen A, Raeder B, et al. Pan-cancer analysis of somatic copy-number alterations implicates IRS4 and IGF2 in enhancer hijacking. נאט ג'נט. 201749:65–74.

Godinho M, Meijer D, Setyono-Han B, Dorssers L, van Agthoven T. Characterization of BCAR4, a novel oncogene causing endocrine resistance in human breast cancer cells. J Cell Physiol. 2011226:1741–9.

Kim J, Piao H, Kim B, Yao F, Han Z, Wang Y, Xiao Z, Siverly A, Lawhon S, Ton B, et al. Long noncoding RNA MALAT1 suppresses breast cancer metastasis. נאט ג'נט. 201850:1705–15.

Yang X, Han H, De Carvalho D, Lay F, Jones P, Liang G. Gene body methylation can alter gene expression and is a therapeutic target in cancer. Cancer Cell. 201426:577–90.

Dixon J, Selvaraj S, Yue F, Kim A, Li Y, Shen Y, Hu M, Liu J, Ren B. Topological domains in mammalian genomes identified by analysis of chromatin interactions. טֶבַע. 2012485:376–80.

Andersson R, Gebhard C, Miguel-Escalada I, Hoof I, Bornholdt J, Boyd M, Chen Y, Zhao X, Schmidl C, Suzuki T, et al. An atlas of active enhancers across human cell types and tissues. טֶבַע. 2014507:455–61.

Taylor A, Shih J, Ha G, Gao G, Zhang X, Berger A, Schumacher S, Wang C, Hu H, Liu J, et al. Genomic and functional approaches to understanding cancer aneuploidy. Cancer Cell. 201833:676–89.

Knijnenburg T, Wang L, Zimmermann M, Chambwe N, Gao G, Cherniack A, Fan H, Shen H, Way G, Greene C, et al. Genomic and molecular landscape of DNA damage repair deficiency across The Cancer Genome Atlas. Cell Rep. 201823:239–54 1.

Bindea G, Mlecnik B, Tosolini M, Kirilovsky A, Waldner M, Obenauf A, Angell H, Fredriksen T, Lafontaine L, Berger A, et al. Spatiotemporal dynamics of intratumoral immune cells reveal the immune landscape in human cancer. חֲסִינוּת. 201339:782–95.

Thorsson V, Gibbs D, Brown S, Wolf D, Bortone D, Ou Yang T, Porta-Pardo E, Gao G, Plaisier C, Eddy J, et al. The immune landscape of cancer. חֲסִינוּת. 201848:812–30.

Mermel CH, Schumacher SE, Hill B, Meyerson ML, Beroukhim R, Getz G. GISTIC2.0 facilitates sensitive and confident localization of the targets of focal somatic copy-number alteration in human cancers. גנום ביול. 201112:R41.

Alaei-Mahabadi B, Bhadury J, Karlsson J, Nilsson J, Larsson E. Global analysis of somatic structural genomic alterations and their impact on gene expression in diverse human cancers. Proc Natl Acad Sci U S A. 2016113:13768–73.

Drier Y, Lawrence M, Carter S, Stewart C, Gabriel S, Lander E, Meyerson M, Beroukhim R, Getz G. Somatic rearrangements across cancer reveal classes of samples with distinct patterns of DNA breakage and rearrangement-induced hypermutability. Genome Res. 201323:228–35.

Esteller M. Epigenetics in cancer. N Engl J Med. 2008358:1148–59.

Eden A, Gaudet F, Waghmare A, Jaenisch R. Chromosomal instability and tumors promoted by DNA hypomethylation. מַדָע. 2003300:455.

Coarfa C, Pichot C, Jackson A, Tandon A, Amin V, Raghuraman S, Paithankar S, Lee A, McGuire S, Milosavljevic A. Analysis of interactions between the epigenome and structural mutability of the genome using Genboree Workbench tools. BMC ביואינפורמטיקה. 201415(Suppl 7):S2.

Hajkova P, Jeffries S, Lee C, Miller N, Jackson S, Surani M. Genome-wide reprogramming in the mouse germ line entails the base excision repair pathway. מַדָע. 2010329:78–82.

Laird P, Jaenisch R. DNA methylation and cancer. הום ​​מול ג'נט. 19943 Spec No:1487–95.

James S, Pogribny I, Pogribna M, Miller B, Jernigan S, Melnyk S. Mechanisms of DNA damage, DNA hypomethylation, and tumor progression in the folate/methyl-deficient rat model of hepatocarcinogenesis. J Nutr. 2003133:3740S–7S.

Yung C, O'Connor B, Yakneen S, Zhang J, Ellrott K, Kleinheinz K, Miyoshi N, Raine K, Royo R, Saksena G, et al. Large-scale uniform analysis of cancer whole genomes in multiple computing environments. Preprint at. 2017. https://doi.org/10.1101/161638.

Wala J, Shapira O, Li Y, Craft D, Schumacher S, Imielinski M, Haber J, Roberts N, Yao X, Stewart C, et al. Selective and mechanistic sources of recurrent rearrangements across the cancer genome. Preprint at. 2017. https://doi.org/10.1101/187609.

Chen K, Wallis J, McLellan M, Larson D, Kalicki J, Pohl C, McGrath S, Wendl M, Zhang Q, Locke D, et al. BreakDancer: an algorithm for high-resolution mapping of genomic structural variation. שיטות נאט. 20096:677–81.

Chen F, Zhang Y, Şenbabaoğlu Y, Ciriello G, Yang L, Reznik E, Shuch B, Micevic G, De Velasco G, Shinbrot E, et al. Multilevel genomics-based taxonomy of renal cell carcinoma. Cell Rep. 201614:2476–89.

Lee A, Ewing A, Ellrott K, Hu Y, Houlahan K, Bare J, Espiritu S, Huang V, Dang K, Chong Z, et al. Combining accurate tumor genome simulation with crowdsourcing to benchmark somatic structural variant detection. גנום ביול. 201819:188.

Fonseca N, Kahles A, Lehmann K-V, Calabrese C, Chateigner A, Davidson N, Demircioğlu D, He Y, Lamaze F, Li S, et al. Pan-cancer study of heterogeneous RNA aberrations. Preprint at. 2017. https://doi.org/10.1101/183889.

The_Cancer_Genome_Atlas_Research_Network. Comprehensive molecular characterization of clear cell renal cell carcinoma. טֶבַע. 2013499:43–9.

Johnson W, Rabinovic A, Li C. Adjusting batch effects in microarray expression data using empirical Bayes methods. Biostatistics. 20078:118–27.

Hoadley K, Yau C, Hinoue T, Wolf D, Lazar A, Drill E, Shen R, Taylor A, Cherniack A, Thorsson V, et al. Cell-of-origin patterns dominate the molecular classification of 10,000 tumors from 33 types of cancer. תָא. 2018173:291–304.

McCarroll S, Kuruvilla F, Korn J, Cawley S, Nemesh J, Wysoker A, Shapero M, de Bakker P, Maller J, Kirby A, et al. Integrated detection and population genetic analysis of SNPs and copy number variation. נאט ג'נט. 200840:1166–74.

Gerstung M, Jolly C, Leshchiner I, Dentro S, Rosado S, Rosebrock D, Mitchell T, Rubanova Y, Anur P, Yu K, et al. The evolutionary history of 2,658 cancers. Preprint at. 2018. https://doi.org/10.1101/161562.

Xie C, Leung Y, Chen A, Long D, Hoyo C, Ho S. Differential methylation values in differential methylation analysis. ביואינפורמטיקה. 201935:1094–7.

Creighton C, Nagaraja A, Hanash S, Matzuk M, Gunaratne P. A bioinformatics tool for linking gene expression profiling results with public databases of microRNA target predictions. RNA. 200814:2290–6.

Saldanha AJ. Java Treeview--extensible visualization of microarray data. ביואינפורמטיקה. 200420:3246–8.

Zhang Y, Yang L, Kucherlapati M, Chen F, Hadjipanayis A, Pantazi A, Bristow C, Lee E, Mahadeshwar H, Tang J, et al. R-code for linear models integrating expression data with somatic structural data. Github. 2019 https://github.com/chadcreighton/SV-expression_integration.


שיטות

Haploproficient genes and orthology analysis

The set of S.cerevisiae genes which are haploproficient in turbidostat culture was obtained using the growth data of [8] and an FDR cutoff of 0.02. This stringent FDR cut-off rigorously defines those genes for which heterozygosity confers a strong fitness advantage, but has no effect on the functional enrichment of genes identified as haploproficient. Genes defined as ‘haploproficient’ for the purposes of this study are listed in Additional file 1: Table S1. The set of chromosome maintenance-associated HP genes described in [8] overlaps, but is not coincident, with the HPGI set studied here, since the current set also includes DNA damage-response genes.

Orthology assignments were made using the InParanoid algorithm [50] and compared with the results of a BLAST [51] reciprocal best-hits search. GO enrichment searches were performed using the Babelomics 4 FatiGO tool [52]. To assess the significance of HP gene conservation, the number of HP genes having orthologs in a given Ascomycete species, given the number of S. cerevisiae HP genes, was compared against the whole-genome conserved proportion using a χ 2 or Fisher exact test (depending on sample size), with the null hypothesis of identical distribution. All findings of significance were reiterated using a Z test for difference of proportions. Where necessary, פ values were corrected for multiple testing using the Bonferroni correction. Cell cycle and DNA damage repair pathways were obtained from the KEGG pathway database [53].

Expression data for S.cerevisae genes was obtained from the Saccharomyces Genome Database [54] and protein expression levels from [55]. A list of human cancer genes/oncogenes was obtained from the Cancer Gene Index [17] enrichment of HP genes amongst the orthologs was determined using a χ 2 test as above. CNV incidence across eight tumour types (breast invasive carcinoma, rectum adencarcinoma colon adenocarcinoma, kidney renal cell clear carcinoma, uterine corpus endometrioid carcinoma, glioblastoma multiforme, acute myeloid leukemia, lung adenocarcinoma, lung squamous cell carcinoma, serous cystadenocarcinoma) as measured by comparative genomic hybridisation, was obtained from the NCI Cancer Genome Atlas online data browser [17] with a copy number (log2 ratio) of magnitude Ϡ.5 taken as the significance threshold. Details of the sampling and analysis of the tumour samples are described in [17]. א P-value for HP ortholog overrepresentation was calculated using a χ 2 test .The TGCA database was also used to perform a pathway search for overrepresentation of HP orthologs.

Yeast strains

In total, 30 HP genes were chosen for analysis, based upon the criteria discussed in the Results above. The heterozygous deletion mutant of each gene was obtained from the heterozygous diploid deletion library (Open Biosystems), in the BY4743 (מַחצֶלֶתא/α, his3D1/his3D1, leu2D0/leu2D0, LYS2/lys2D0, met15D0/MET15, ura3D0/ura3D0) genetic background. For non-essential genes, the homozygous deletant was retrieved from the analogous homozygous diploid deletion library (Open Biosystems).

Control strains were the BY4743 WT, along with the heterozygous deletion mutant of the non-functional his3 locus the non-HP, non-cell cycle הו/הו heterozygous deletion strain and the heterozygous deletion mutant of the non-HP, cell cycle gene HSL1. In addition, heterozygous deletion mutants of the G1 and G2 cyclins were included in several of the experiments. A complete list of the strains used is provided in Additional file 6: Table S6.

Cell-cycle profiling

Flow cytometric analysis of the deletion strains’ cell cycle profiles was carried about following the method of [56]. בקצרה,

10 7 cells in mid-exponential phase were harvested, washed, and fixed in absolute ethanol at 4C overnight. Fixed cells were then collected, washed, and boiled for 15 minutes in 2 mg/mL RNAse in 50 mM Tris-Cl (pH 8), and incubated at 37C for 2� hours. Cells were resuspended in protease solution (5 mg/mL pepsin, 4.5 μL/mL concentrated HCl), incubated for 15 minutes at 37C and resuspended in 50 mM Tris (pH 7.5). For analysis, 50 mL of cell suspension was added to 1 mL of 1 mM Sytox Green in 50 mM Tris pH 7.5), vortexed and analysed using a Cyan flow cytometer (Beckman Coulter). FlowJo (Tree Star) analysis software was used to fit histograms to the peaks representing 1C and 2C DNA content, and thereby calculate the number of cells in the G1 and G2 phases, and infer the number in S phase from the remaining fraction of the population.

Chronological lifespan assay

Cultures were inoculated from frozen stocks, grown overnight in YPD at 3ଌ, and 200mL of each was transferred into a well of a 96-well microtiter plate (Corning). Strains were present in duplicate on each plate, with a buffer of WT in the wells around the edge of the plate, so edge effects would not impact test colony measurements. A Singer Rotor HDA colony pinning robot was used to spot four replicates of each well onto a YPD +� μg/mL phloxine B (Sigma) plate. Phloxine B is a fluorescein derivative taken up when the cell membrane is disrupted upon cell death [57]. Plates were incubated for 48 hours at 3ଌ and photographed using an Epson 1240 Scanner. The colony images were analysed using a custom image-analysis code written in MatLab, with colony size measured by pixel count, and fraction of dead cells by the intensity of colony redness [10]. Since these parameters are independent, this allowed the dissection of the effect of cell viability upon colony growth from that of growth rate variation. The 96-well liquid cultures were incubated at 3ଌ, and, every second day over a period of three weeks, the colony-pinning onto YPD + phloxine B and image analysis repeated. For each plate, the median culture intensity for each strain was compared with the growth of the WT on that plate, and also with the strain growth and viability after the initial 48-hour period. The experiment was performed twice.

At several points throughout the 3-week period, several strains were selected at random, and viability assayed by performing serial dilutions and counting colony-forming units. These results were checked for compatibility with the microplate viability results.

Apoptosis assays

The rate of occurrence of apoptosis in the different strain populations was measured in two ways. Apoptosis was first induced by pretreating cells with 0.001%, 0.01% MMS, 0.0001% or 0.001% TBHP in overnight culture keeping a negative, non-induced WT control sample.

The translocation of phosphatidyl serine to the cell surface, a marker of apoptosis [58], was measured using an Annexin V-FITC Apoptosis Detection kit. (Sigma). Cells were harvested, washed in 1.2M sorbitol, 0.5 mM MgCl2, 35 mM K phosphate (pH 6.8) and then digested in 5.5% glusulase (Sigma) and 15 U/mL lyticase (Sigma) for 2 hours at 28C. Spheroplasts were harvested, washed in binding buffer (10 mM Hepes/NaOH pH 7.4, 140 mM NaCl, 2.5 mM CaCl2 in 1.2 M sorbitol buffer) and resuspended in binding buffer/sorbitol. 5 mL of FITC-labelled annexin V, and 10 mL of 10010 mg/mL propidium iodide were added to each sample, with control samples containing 1.) no label, 2.) FITC-annexin V only, and 3.) PI only. Fluorescence was quantified using a CyAn (Beckman Coulter). Gates were fitted on the basis of the the control samples, dividing a log PI versus log FITC plot into four quadrants: lower left (neither FITC nor PI-stained) – viable cells upper left (PI stain only) – necrotic cells lower right (FITC only) – early apoptotic cells and upper right (PI and FITC-stained) – late apoptotic cells. FlowJo software (TreeStar) was used to count the fraction of the total cell population in each quadrant. The proportion of both necrotic and apoptotic cells for each strain was normalised to strain viability (i.e. on the basis of the proportion of cells assigned to the lower-left FITC/PI quadrant), and the ratio of necrotic:apoptotic cells calculated. Ratios for each strain were normalised to the WT value, and the standard deviation across all samples calculated. Strains having a necrosis:apoptosis ratio further than 1.5x this standard deviation from WT levels were deemed to demonstrate abnormal apoptosis rates.

Growth rate and drug sensitivity assays

Growth and drug sensitivity assays were performed both on solid media and in liquid cultures. For solid assays, the required drug concentration was added to YPD-agar containing 10μg/m/mL phloxine B. Overnight cultures of the strains were spotted onto the (drug-containing) plates using a Singer rotor, as above. Plates were incubated at 3ଌ and photographed at 24 and 48 hours and analysed using an image-processing code as described above. Strain growth and viability was compared both with WT growth on the same plate, and with growth on YPD-agar (or YPD-agar plus DMSO, where the drug is DMSO-soluble). The ratio of viability and size with and without drug was calculated for every strain on a plate, and the standard deviation of all ratios calculated. Strains having a drug:untreated ratio greater than or less than two standard deviations from that of the WT were deemed to be resistant and sensitive, respectively.

Assays in liquid culture were performed by transferring 5mL of overnight culture into each well of a 96-well microtitre plate, containing 200 μL of YPD plus the required concentration of drug. Absorbance was measured for 30 hours at 3ଌ using a BMG Optima platereader, maximum growth rate calculated using a curve-fitting script written in R, and the growth rate for each strain compared with that of the WT in the same plate, and growth in YPD/YPD +𠂝MSO.


2. שיטות

This section proposes an expanded graph database model that includes the gene expression, miRNA expression, DNA methylation, copy number gain and loss information, tissue slide information, and mutation data from TCGA. It also outlines the steps performed to create the proposed graph database model.

2.1. נתונים

For this study, we have specifically added copy number information, miRNA expression, and image information of the tissue slide to the previously stored clinical information, gene expression (log2 counts per million), hyper and hypomethylation information, and mis-sense mutation data from the Genomics Data Commons (GDC) for breast cancer (BRCA), prostate adenocarcinoma (PRAD), and the pancreatic adenocarcinoma (PAAD). Table 1 shows the summary information about the data set used for this study.


צפו בסרטון: הפיכת מוצר בלי וריאציות לעם וריאציות (פברואר 2023).