מֵידָע

כיצד ניתן לחזות את דפוס המתילציה?

כיצד ניתן לחזות את דפוס המתילציה?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

נניח שיש לנו DNA כפול גדילים כמו

5' AGגTAGGAGAGACCAGGTTCC 3'

3 'טגGATCCטגטגTGGTCCAAGG 5'

היכן יהיה הציטוזין המתילט? האם יש אקראיות?


זיהוי in vivo קישור גורם שעתוק (TF) חשוב להבנת מעגלי ויסות גנים. ChIP-seq היא טכניקה עוצמתית להגדרה אמפירית של כריכת TF in vivo. עם זאת, ריבוי ה-TFs המובהקים הופך את פרופיל הגנום לכולן לצריך עבודה ויקר. אלגוריתמים עבור בסיליקו פותחו חיזוי של קשירת TF, המבוססים בעיקר על שינוי היסטון או נתוני רגישות יתר של DNase I בשילוב עם מוטיב DNA ותכונות גנומיות אחרות. עם זאת, מגבלות טכניות של שיטות אלו מונעות יישום רחב, במיוחד במסגרות קליניות. ערכנו סקר מקיף שכלל שורות תאים מרובות, TFs וסוגי מתילציה ומצאנו שיש קשרים אינטימיים בין שינויי קישור TF לשינוי רמת המתילציה סביב אתרי הקישור. בניצול הקשר בין מתילציה של DNA לבין מחייב TF, הצענו גישת למידה חדשה בפיקוח לחיזוי אינטראקציה של TF-DNA באמצעות נתונים מניסויי רצף מתילציה ברזולוציה בסיסית שלם. תכננו מודלים בטא בינומיים לאפיין נתוני מתילציה סביב אתרי כריכת TF והרקע. יחד עם תכונות גנומיות סטטיות אחרות, אימצנו מסגרת יער אקראית לחזות אינטראקציה TF -DNA. לאחר ביצוע בדיקות מקיפות, ראינו שהשיטה המוצעת מנבאת במדויק את כריכת TF ומבצעת שיטות חיוביות לעומת שיטות מתחרות.

מטרה בסיסית של מחקר גנומי פונקציונלי היא להבין את ויסות הגנים. ניתן לשלוט על ביטוי גנים על ידי מנגנונים אפיגנטיים באמצעות קישור מתואם של גורמי שעתוק (TFs), שינויים היסטונים ומתילציה של DNA (1). צעד ראשון וחשוב לקראת פענוח המורכבות של רשתות מווסתות של גנים הוא זיהוי הפעילויות של אלמנטים תפקודיים, כגון אתרי קישור TF בגנום.

התקדמות בטכנולוגיות רצף בתפוקה גבוהה כגון ChIP-seq (2-4) ו- ChIP-exo (5) מאפשרות פרופיל מקיף של כל הגנום של אתרי קישור חלבון- DNA. בשנים האחרונות נעשו מאמצים עצומים למפות אתרי קשירת TF בהקשרים ביולוגיים שונים למשל, על ידי קונסורציומים כמו ENCODE (6) ו- modENCODE (7). למרות ההצלחות, היישום של ChIP-seq עדיין מוגבל על ידי הזמינות של נוגדנים איכותיים ודרישה לתאים/רקמות טריים. ריבוי החלבונים הנבדלים הופך את פרופיל הגנום כולו עבור כולם לצריך עבודה ויקר. יתר על כן, פרופיל אישי של כריכת TF מהווה אתגר במסגרות קליניות מכיוון שכמות החומרים הביולוגיים הזמינים לרוב מוגבלת. מסיבות אלה, מתפתח בסיליקו גישות לחיזוי in vivo אתרי איגוד TF שאינם מסתמכים על ChIP-seq רצוי.

באופן מסורתי, מוטיבים של רצפי DNA שימשו לחיזוי קשירת TF (8, 9). עם זאת, גישה כזו פועלת היטב רק לחלבונים בעלי מוטיבים מחייבים שהם ספציפיים ביותר. עבור חלבונים עם דפוסי מוטיב קשירה חלשים, התחזיות סובלות מספציפיות נמוכה. בנוסף, מוטיב ה-DNA אינו מספיק כדי לקבוע אם TF ייקשר ל-DNA in vivo, כלומר לא ניתן לקבוע קישור ספציפי לסוג תא יש צורך במידע נוסף כדי לבצע חיזוי זה. מחקרים אחרונים גילו שקשירת TF קשורה לעמדות נוקלאוזומים (10), סימני היסטון (4, 11), ורגישות יתר לביקוע על ידי DNase I (12, 13). בהתבסס על ממצאים אלה, פותחו מספר שיטות סטטיסטיות וכלים תוכנתיים לשילוב מידע מוטיב עם סוגי נתונים אחרים והערות גנום בכדי להשיג תוצאות חיזוי טובות יותר (10, 14–20). כל השיטות הללו משתמשות בנתוני היסטון או DNase I, כמו גם בביאורי הגנום ובמוטיבים של DNA לצורך חיזוי. אחת המגבלות הנפוצות היא ששינוי ההיסטון או מחקרי רגישות יתר ל- DNase I דורשים כמויות גדולות של חומר מוצא טרי (לפחות מ -10 6 תאים). זה הופך את שיטות החיזוי הקיימות (טבלה חומרים משלימים S1) ליישמים כמעט לדגימות קליניות.

מתילציה של DNA היא שינוי אפיגנטי חשוב עם תפקידים חיוניים בתהליכים ביולוגיים רבים (21, 22). מתילציה של ציטוזין בפחמן חמש (5-מתילציטוזין, או 5mC) מסדירה את ביטוי הגנים, קובעת את התפתחות התאים ומשפיעה על פתוגנים רבים של מחלות (22, 23). תוך ניצול טכנולוגיות רצף הדור הבא, פותח מבחן ניסיוני רב עוצמה הנקרא רצף ביסולפיט (BS-seq) שמודד מתילציה של DNA ברזולוציית בסיס לכל רחבי הגנום (24-26). הניסוי מתחיל בטיפול במולקולות ה- DNA עם נתרן, מה שמעורר דימינציה והמרה של ציטוזין לא מתילתי לאורציל, בעוד שציטוזין מתילט מוגן על ידי קבוצת המתיל ונשאר ללא שינוי. ה- uracil יוגבר כתימין במהלך ההגברה. מקטעי ה-DNA המטופלים בביסולפיט ומקטעי ה-PCR מוגברים לאחר מכן עוברים רצף בתפוקה גבוהה. לאחר יישור ועיבוד מקדים, ניתן לנתח נתוני BS-seq על ידי ספירת מספר קריאות הרצף עבור כל אתר CpG שבו נצפה תימין או ציטוזין. הספירה של תימין מייצגת את מספר גדילי ה-DNA ברצף שאינם מתילטים, וספירת הציטוזין מייצגת את מספר גדילי ה-DNA המתילטים באתר CpG זה.

5mC ידוע כמפריע לאינטראקציות בין DNA לחלבון, ובכך מכוון מצבי תעתיק (27). לדוגמה, פרסום אחרון דיווח כי 5mC נמצא בקורלציה חזקה עם קישור TF, כאשר אתרי הקישור הם בדרך כלל hypomethylated (28). ויסות של אינטראקציות בין דנ"א לחלבון יכול להתרחש או באמצעות זיקה של חלבונים הקושרים מתיל- CpG למשך 5mC, או באמצעות ההשפעות עקשן של 5mC על כמה אינטראקציות בין DNA לחלבון. האחרון ידוע כמשפיע ישירות על קישור מספר TFs, כגון CTCF (29). יתר על כן, תצפיות עדכניות יותר הצביעו על החמצון האיטרטיבי של 5mC ל-5-hydroxymethylcytosine (5hmC), 5-formylcytosine (5fC) ו-5-carboxylcystosine (5caC) במסלולים המשמשים לקיזוז רמות 5mC ולהקל על קישור TF (30). כל הממצאים הללו מצביעים על כך שרמות המתילציה של ה-DNA מציעות רמזים לשאלה האם קישור TF התרחש במיקום מסוים, אשר עשוי להיות מנוצל כחלופה לנתוני DNase I או ההיסטון לצורך חיזוי קישור TF in vivo. זה חשוב מכיוון שפרופילי מתילציה של DNA הם יציבים יותר והרבה יותר קלים להשגה מפרופילי DNase I בסביבה קלינית.

כדי לחקור את הכדאיות של השערה זו, יישרנו פרופילים של DNase I, מתילציה וקשירת TF שהתקבלו על ידי DNase-seq, BS-seq ו- ChIP-seq, בהתאמה, בהם נתוני ה- ChIP-seq משמשים כתקן הזהב עבור TF כריכה. בדיקה חזותית הראתה שיש התאמה טובה בין פסגות ה-ChIP-seq, שיאי DNase I, ו"מטבלים" של מתילציה. כדוגמה, איור 1 מציג אתרי קשירה ל-CTCF אחד ב-H1-hESC, אשר ממוקם באתר התחלת שעתוק (TSS) של גן מקודד חלבון. ניתן לראות בבירור כי באתרי איגוד ה- TF (המסומנים על ידי פסגות ChIP-seq), נתוני DNase-seq מצביעים על העשרה של אתרי רגישות יתר ל- DNase I. באותם מיקומים, רמות המתילציה של ה- DNA משתנות ומראות היפומטילציה חזקה.

התאמה בין ChIP-seq, DNase I ומתילציה על לוקוס גנומי. תצוגה השוואתית של פרופילי DNase I רגישים יתר, מתילציה (5mC) ו-ChIP-seq על מיקום גנומי בכרומוזום 10. קונקורדנציות טובות מוצגות בין פסגות ChIP-seq (המשמשים כסטנדרט הזהב לקשירת TF), שיא DNase I ו 'מטבלים' של מתילציה. כל הנתונים המוצגים הם מקו התא H1-hESC.


מבוא

מלנומה עורית (CM) היא ניאופלזמה ממאירה המאופיינת בהתקדמות מהירה, גרורות לבלוטות הלימפה האזוריות כמו גם לאיברים רחוקים, והיענות מוגבלת לטיפולים (MacKie et al., 2009). הוא תורם ליותר מ -80% מוות של חולי סרטן העור (מילר ומיהם, 2006), ושכיחותו היא אחת ממקרי הסרטן הגדלים במהירות ביותר בארצות הברית, שם ההערכה היא שיהיו 91,270 מקרים חדשים ו -9,320 מקרי מוות למחלה זו בשנת 2018 (Siegel et al., 2018). למרות שהושגה התקדמות משמעותית הן בהבנת הביולוגיה של CM והן בגנטיקה, והן בגישות טיפוליות, הפרוגנוזה נשארת גרועה בשל הפוטנציאל הגבוה לפלישת CM וגרורות. ממאירות זו עדיין מהווה בעיה גדולה של בריאות הציבור ברחבי העולם. למלנומה מקומית ראשונית יש שיעור הישרדות גבוה יחסית. פרוגנוזה של שיעור ההישרדות ל-5 שנים של חולים עם בלוטות לימפה או גרורות מרוחקות הייתה רק 15-20% (Siegel et al., 2018 Weiss et al., 2015). הערכת מטופלים לפני הטיפול עשויה לסייע בזיהוי אנשים בסיכון גבוה להישנות ועשויה להנחות את פיתוח אסטרטגיות הטיפול הממוקדות בעתיד. לדוגמה, לחולים הנמצאים בסיכון אופרטיבי גבוה, טיפול שמרני עשוי להועיל בתהליך קבלת ההחלטות האופרטיביות. סמנים ביולוגיים מולקולריים יכולים לספק מידע פרוגנוסטי נוסף ותובנה לגבי מנגנוני התקדמות המלנומה, כמו גם להנחות את בחירת הטיפול. כתוצאה מכך, אסטרטגיות חדשות לזיהוי סמנים ביולוגיים פרוגנוסטיים יעילים עשויות לשפר את הניהול הקליני של מלנומה על ידי מתן מידע פרוגנוסטי מדויק יותר.

מתילציה של DNA חריגה היא סימן היכר אפיגנטי של סרטן ותורמת באופן פעיל להתפתחות והתקדמות הסרטן על ידי הפעלת גנים מדכאי גידולים (Egger et al., 2004). כמה מאפיינים של סמני מתילציה הופכים אותם לאטרקטיביים במיוחד לפיתוח סמנים ביולוגיים ישימים קלינית, כולל יציבות גבוהה בדגימות ביולוגיות, רגישות מוגבלת לגורמים סביבתיים של גידול וקלות זיהוי (Keeley et al., 2013). מספר הולך וגדל של מחקרים הוכיח שמתילציה חריגה של DNA ממלאת תפקידים חשובים בהתקדמות הגידול, ולמתילציה של DNA יש פוטנציאל גדול לשמש כסמן ביולוגי לניבוי הפרוגנוזה של חולים עם מגוון מחלות ממאירות (Egger et al., 2004 Guo et. al., 2004 Roh et al., 2016). לדוגמה, GATA4 מושתק אפיגנטית בסרטן במערכת העיכול (Akiyama et al., 2003) ובסרטן ריאות (Guo et al., 2004) OPCML מתילציה של האמרגן זוהתה כסמן ביולוגי לחיזוי הפרוגנוזה של סרטן השחלות (Zhou et al., 2014) PCDH19 מתילציה קשורה לפרוגנוזה גרועה של סרטן הפטו -תאי (Zhang et al., 2018) ו- Sigalotti ואח '. זיהה חתימת מתילציה של 17 גנים כסמן מולקולרי להישרדות במלנומה שלב IIIC (Sigalotti et al., 2012). למרבה הצער, למחקרי מלנומה רבים אחרונים יש מספר מגבלות כולל קבוצות מדגם קטנות יחסית, היעדר אימות סמן ביולוגי לאחר מכן, התמקדות צרה בדגימות חולים עם מאפיינים קליניים ספציפיים, או חקירה של גן אחד או כמה גנים בלבד. מחקרים אלה חסרים את הגישה המקיפה והשיטתית של ניתוח מתילציה רחב הגנום. בשל כך, לחתימות המתילציה שזוהו אין כוח פרוגנוסטי אוניברסלי, והיכולת שלהן מוגבלת על ידי סוג הדגימה. מאגר הנתונים של הגנום הסרטן (TCGA) (Hudson et al., 2010), מאגר נתונים גדול עם הרבה מודעות עם כמעט 500 דגימות CM שנאספו ברחבי העולם הוא משאב מועיל לפיתוח סמנים ביולוגיים מבטיחים עם מחקרים פרוספקטיביים לחתימת מתילציה שיכולה להיות של קלינית תוֹעֶלֶת.

כתוצאה מכך, מטרת מחקר זה הייתה לזהות סמנים ביולוגיים של מתילציית DNA על מנת לבחון את התועלת של ניתוח מתילציה של DNA לפרוגנוזה של סרטן. כל פרופילי המתילציה של הגנום של רקמות הגידול של חולים עם CM במאגר הנתונים של TCGA נותחו, והמשמעות הקלינית הפוטנציאלית של סמנים ביולוגיים המתילציה המשמשים כמנבאים פרוגנוסטיים מולקולריים נבדקה באמצעות שיטת קפלן -מאייר וניתוחי מאפייני פעולה (ROC). יתר על כן, היכולת הפרוגנוסטית של הסמן הביולוגי המתילציה שזוהה הוערכה עם קבוצה עצמאית של חולים במסד הנתונים של Gene Expression Omnibus (GEO). כמו כן, חקרנו את העצמאות והשחזור בקבוצות קליניות שונות, כמו גם את התפקיד האפשרי של הסמן הביולוגי של המתילציה במחסור חיסוני של מחסום חיסוני (ICB).


דפוסי מתילציה של DNA של יונקים משתנים בזמן ובמרחב

בתאים סומטיים אנושיים, m 5 C מהווה ~1% מסך בסיסי ה-DNA ולכן משפיע על 70%-80% מכלל הדינוקלאוטידים CpG בגנום (Ehrlich 1982). דפוס ממוצע זה מסתיר וריאציה זמנית ומרחבית מסקרנת. במהלך שלב דיסקרטי של התפתחות עכבר מוקדמת, רמות המתילציה בעכבר יורדות בחדות ל -30% מהרמה הסומטית האופיינית (Monk et al. 1987 Kafri et al. 1992). מתילציה דה נובו משחזרת רמות תקינות עד זמן ההשתלה. ירידה הרבה יותר מוגבלת במתילציה מתרחשת בצפרדע Xenopus laevis (Stancheva and Meehan 2000), ולא רואים טיפה בדג הזברה, דניו ריו (McLeod et al. 1999). אפילו בתוך בעלי חוליות, לפיכך, רואים וריאציה בין המינים שיכולה לשקף הבדלים בתפקיד המדויק של מתילציה באורגניזמים אלה. עם זאת, בעכברים וכנראה ביונקים אחרים, מחזור הדמתילציה העוברית המוקדמת ואחריו מתילציה דה נובו הוא קריטי בקביעת דפוסי מתילציה DNA סומטיים. הפחתה בכל הגנום במתילציה נראית גם בתאי נבט קמאי (Tada et al. 1997 Reik et al. 2001) במהלך השלבים האוגוניאליים והזרעיים.

המאפיין הבולט ביותר של דפוסי מתילציה של DNA חולייתנים הוא נוכחותם של איי CpG, כלומר אזורים עתירי GC שאינם מתיליים ובעלי צפיפות יחסית גבוהה של CpG וממוקמים בקצות 5 'של גנים אנושיים רבים (לעיון, ראה ציפור 1987 ). ניתוח חישובי של רצף הגנום האנושי מנבא 29,000 איי CpG (Lander et al. 2001 Venter et al. 2001). מחקרים קודמים העריכו ש-60% מהגנים האנושיים קשורים לאיי CpG, שרובם הגדול אינם מתילטים בכל שלבי ההתפתחות ובכל סוגי הרקמות (Antequera and Bird 1993). מכיוון שאיי CpG רבים ממוקמים בגנים שיש להם דפוס ביטוי מוגבל רקמות, מכאן נובע שאיי CpG יכולים להישאר ללא מתילציה גם כאשר הגן הקשור אליהם שקט. לדוגמה, לרקמות הא-α-globin האנושיות המופיעות ברקמות (Bird et al. 1987) ו- α 2 (1) קולגן (McKeon et al. 1982) יש גנים של CpG שנשארים ללא מתילציה בכל הרקמות שנבדקו, ללא קשר לביטוי.

חלק קטן אך משמעותי מכל איי CpG הופכים למתילטים במהלך הפיתוח, וכאשר זה קורה היזם המקושר שותק יציב. מתילציה של CpG-island מתוכנת מבחינה התפתחותית מסוג זה מעורבת בהטבעה גנומית ובאי-הפעלת כרומוזום X (ראה להלן). אירועי המתילציה דה נובו מתרחשים בתאי נבט או בעובר המוקדם (Jaenisch et al. 1982), מה שמצביע על כך שמתילציה דה נובו פעילה במיוחד בשלבים אלה. יש ראיות, עם זאת, שמתילציה דה נובו יכולה להתרחש גם בתאים סומטיים בוגרים. חלק ניכר מכל איי ה- CpG האנושיים מועדים למתילציה פרוגרסיבית ברקמות מסוימות במהלך ההזדקנות (לעיון, ראה עיסא 2000), או בתאים חריגים כגון סרטן (לסקירה, ראו ביילין והרמן 2000) וקווי תאים קבועים (האריס 1982 Antequera et al. 1990 Jones et al. 1990). נראה כי קצב ההצטברות של CpGs מתילטים בתאים סומטיים הוא איטי מאוד. לדוגמה, מתילציה דה נובו של פרו-וירוס בתאי אריתרולוקמיה של עכברים ארכה שבועות רבים להשלמה (Lorincz et al. 2000). באופן דומה, התאוששות רמות המתילציה העולמיות של DNA בעקבות טיפול כרוני בתאי עכבר עם מעכב מתילציית ה- DNA 5-azacytidine נדרשה חודשים (Flatau et al. 1984).

כיצד מתפתחים דפוסים של דנ"א יונקים מתילטיים ובלתי מתואלים בהתפתחות וכיצד הם נשמרים? מדוע איי CpG בדרך כלל, אך לא תמיד, נטולי מתילציה? מה גורם למתילציה של DNA בתפזורת שאינה CpG-אי? על שאלות בוערות אלו לא ניתן לענות באופן סופי כיום, אך ישנן השערות מובחנות אשר טופלו בניסוי. הנתונים הזמינים ייחשבו בנוחות בשלושה חלקים: (1) מנגנונים לשמירה על דפוסי מתילציה של DNA (2) מנגנונים ותוצאות של רווח מתילציה (3) מנגנונים ותוצאות של אובדן מתילציה.


דוגמנות שינוי היסטון חלוקתי על ידי Dot1 מתיל העברות

דירק דה ווס,. פרד ואן ליוון, באפיגנטיקה וביולוגיה של מערכות, 2017

מבוא

מתילציה של חלבון היסטון מעורבת באופן אינטימי בפונקציות רגולטוריות רבות בתיווך הכרומטין של הגנום [1]. מתילציה של היסטונים מתרחשת בעיקר על ליזינים וארגינינים, והאתר המדויק של השינוי קובע את ההשלכות במורד הזרם. מתילציה של היסטון H3K79 על ידי Dot1 (אצל יונקים הנקראים DOT1-like או DOT1L) היא מערכת שינוי אבולוציונית שנשמרה עם פונקציות חשובות [2-6]. Dot1 התגלה במקור בשמרים ניצנים, שם הוא משפיע על השתקת גנים, תגובת נזקי DNA ותיקון וסימון מחסומים מיוטיים. בזבובים, תולעים ויונקים ידוע כי DOT1L מעורב בתעתיק גנים. ביונקים הוכח כי מתילציה של DOT1L ו- H3K79 משמשת כמחסום כנגד תכנות מחדש [7] ומתווכת גידולים על ידי התמזגות אונקוגנית מסוימת של הגן לוקמיה של השושלת המעורבת (MLL) 1 (MLL1) [8]. חשוב לציין, מעכבי DOT1L נמצאים כעת בניסויים קליניים לטיפול בלוקמיה מאורגנת מחדש של MLL אנושית, שבה וויסות שגוי של DOT1L אחראי על טרנספורמציה אונקוגנית [8]. לבסוף, בטריפנוזומים אפריקאיים שני חלבוני Dot1 יוצרים יחד דפוס מתילציה דינמי המבטיח התקדמות תקינה של מחזור התא ושונות אנטיגני [9-13]. למרות שזוהו מספר חלבונים שיכולים לתווך את ההשפעה של מתילציה של H3K79 או "לקרוא" את מצב המתילציה שלו, כיצד מתילציה Dot1 ו-H3K79 שולטת במבנה ותפקוד הכרומטין עדיין לא מובן. מידע נוסף על הפונקציה והוויסות של Dot1/DOT1L ניתן למצוא במספר מסמכי סקירה [2-6].

מתילציה של H3K79 על ידי Dot1/DOT1L זכתה לתשומת לב מיוחדת גם בגלל תכונותיה הבלתי שכיחות [2,4]. מאפיין חשוב אחד הוא מיקומו של H3K79 על פני השטח הכדוריים של ליבת הנוקלאוזום (איור 6.1), המנוגד לרוב אתרי המתילציה האחרים, הממוקמים על זנבות ההיסטון הלא מובנים [16-18]. ואכן, Dot1 מתילט H3K79 רק בהקשר של נוקלאוזום, המונע שימוש במצעים פפטידים פשוטים במבחני מתיל -טרנספראז [16,19,20]. לכן, ניתוח הקשר והפעילות של Dot1 כלפי פפטידים סינתטיים עם מצבי מתילציה מוגדרים אינו אפשרי. תכונה מעניינת נוספת שמבדילה את Dot1 משאר מתילטרנספראזות היסטון ליזין היא שאין לה SET (סu (var) 3-9, הnhancer-of-zeste, טrithorax) תחום. זה יוצא דופן מכיוון שהתחום SET מהווה את החלק הקטליטי של הרוב המכריע של מתיל-טרנספראזות היסטון ליזין היסטון [21–23]. במקום זאת Dot1 מכיל תחום מתיל-טרנספראז מסוג I [19,24,25]. זה גורם למנגנונים ברורים של מתילציה וויסות בין מתילטרנספראזות [21,26,27]. לבסוף, חלבון Dot1 יחיד אחראי על מונו-, די- וטרימתילציה של H3K79, אם כי אצל מינים מסוימים משימה זו מתחלקת בין חלבונים מרובים של Dot1, כפי שיפורט להלן. באופן כללי, השליטה במצבי המתילציה השונים של H3K79 והתפקודים הספציפיים שלהם עדיין אינם מובנים. זוהו כמה מנגנונים המקדמים מתילציה של H3K79, כולל כל הזנב של הזנב C- מסוף של היסטון H2B (H2Bub) לאורך אזורים מתומללים וגיוס DOT1L לגנים באמצעות האינטראקציה שלו עם AF9, AF10 ושותפי חלבון אחרים [2]. עם זאת, כיצד H2Bub משפיע על פעילות Dot1 ברמה המולקולרית אינו מובן היטב [2,28–31]. שלב ראשון חשוב בהסבר השינויים במתילציה שנראים כאשר מסכנים רגולטוריים נפגעים הוא להבין כיצד נקבעים מצבי המתילציה (המרובים), כלומר הכרת אופן המתילציה והפרמטרים הקינטיים.

איור 6.1. Dot1 מתיל את ההיסטון H3K79 על פני השטח של הליבה הנוקלאוזום.

מבנה נוקלאוזום השמרים (PDB 1ID3 [14] , חזותי באמצעות Chimera [15] ) במבט קדמי (A) ובמבט מהצד (B). זנבות היסטון נעדרים ממבנה הגביש.

סוגיה בולטת נוספת היא מידת הדינמיות של נוף המתילציה הסלולרי של H3K79. שינויים בהיסטון יחד עם מנגנונים אחרים מגדירים את הזהות האפיגנטית של תא. עם זאת, אין זה אומר ששינויי היסטון הם סטטיים. שינויים מסוימים כפופים להוספה והסרה דינמית על ידי שינוי ופינוי אנזימים, מתן הזדמנויות להתאמות על ידי איתות לפעילויות מנוגדות אלו [1] . עד כה לא דווח על דמטילאזים עבור H3K79me [32], דבר המצביע על כך שמנגנונים אחרים עשויים לפעול נגד אנזימי Dot1. שכפול ה-DNA והכפילות הנלווית של כרומטין הוא בהגדרה תהליך המשבש את דפוס המתילציה על ידי דילול של היסטונים הקשורים לכרומטין שעברו שינויים עם היסטונים חדשים שעברו סינתזה שאינם משנים, או שהשתנו על ידי מה שנקרא שינויים במצב הקרקע [33-35] . למרות שחלק מהשינויים בהיסטון כגון אצטילציה והיסטוריה של היסטון מראים תחלופה גבוהה וניתן לשקם אותם במהירות לאחר שלב S, מתילציה של היסטון בדרך כלל יציבה יותר ורק לאט לאט מתבססת מחדש [36–41]. האם וכיצד תאים יוצרים מחדש את תבנית השינוי שהתקיימה לפני שלב S היא שאלה מהותית העומדת בלב ליבה של האפיגנטיקה כגורם הקובע את זהות התא. הבנת הופעתם של דפוסי מתילציה של היסטון לאורך מחזור התא דורשת הבנה מפורטת של המאפיינים הביוכימיים הפנימיים של מתיל טרנספרזים כמו Dot1.

בהתחשב במגבלות והאתגרים של מבחני מתילציה חוץ גופית ביצענו שילוב של הנדסה גנטית בשמרים, מדידות כמותיות ומודלים מתמטיים כדי לחלץ מידע על התכונות הבסיסיות של Dot1 בתא החי (איור 6.2). כאן אנו מתארים את מאמצינו לקבוע את מנגנון המתילציה על ידי Dot1 וכיצד זה מזין את ויסות הנוף H3K79me בתא. שאלה זו רלוונטית ביותר בשל תפקידה של Dot1 בתהליכים סלולריים מאוד בסיסיים [2-5,42].

איור 6.2. ייצוג סכמטי של יחסי הגומלין המשתנים בין ניסוי לאורך המחקרים המתוארים.

מודלים I–V (צבע אדום) תואמים למערכות שונות של משוואות דיפרנציאליות (לא רק הבדלי פרמטרים). מודל I מייצג את מודל האוכלוסייה (מצב יציב) עם קינטיקה חלוקתית. דגם II מייצג את מה שנקרא מודלים של תא יחיד (מחזור). דגמים III ו- IV מייצגים את המודלים של מצב יציב ומחזור התא, בהתאמה, עם תגובות הפיכות. לבסוף, מודל V הוא מודל התא היחיד המותאם לטריפנוסומה (כלומר, עם שלושה שלבי מחזור תאים מובחנים). לאורך מחזור ביולוגיית המערכות קודמת לכל שלב במודל שאלת מחקר (סמלית) (עם קו תחתון). החצים היוצאים מצביעים על פלט המודל. בגופני צבע כחול מצוין אימות ניסיוני של המודל הקודם. הסברים מפורטים ניתן למצוא בטקסט הראשי.


קהילת המחקר מתעניינת מאוד בשיטה אמינה למדידת גיל ביולוגי: לא בן כמה אתה בשנים, אלא כמה אתה נמצא בתהליך ההזדקנות, כמה נזק הצטבר בתאים ובמאקרומולקולות ועד כמה האיברים שלך טובים או גרועים. ומערכות אחרות מגיבות לנזק זה. מדידה כזו של גיל ידועה בתור סמן ביולוגי של הזדקנות, ולמרות שיש כל מיני מדדים שמתואמים די טוב עם הגיל הביולוגי - מספיק טוב למחקרים סטטיסטיים גדולים כדי להשתמש בהם כדי לכרות נתונים למשמעות - עדיין אין דרך טובה, מדויקת וסטנדרטית להפעיל מספרים ולהשתמש בהם כמדד לגילך.

למה זה חשוב? בעיקר בגלל שעולה כמות עצומה של כסף להעריך את היכולת של כל טיפול להאט או להפוך היבטים של ההזדקנות ובכך להאריך חיים בריאים. הדרך היחידה לדעת כרגע היא לחכות ולראות, ואפילו בעכברים זה אומר שנים ומיליוני דולרים. אבל מה אם נוכל להיות בטוחים למדי שבאמצעות מדידות מסוימות לאחר טיפול בודד, החוקרים יכולים לחזות ברמת דיוק גבוהה אם ההזדקנות מתהפכת או לא מואטת ותוחלת החיים העתידית מאריכה כך? אם יושג, פירוש הדבר יכול להיות עבודה גדולה פי עשרה בהערכת הטיפולים האפשריים בעכברים בכמות מסוימת של מימון. זה עניין גדול, אפילו בלי לקחת בחשבון שהדרך המעשית היחידה לקבוע אם טיפול מאריך חיים משוער באמת עובד או לא בבני אדם היא לקבוע סמן ביולוגי מדויק של הזדקנות על סמך אמצעים מיידיים לטווח קצר. זה פשוט לא מעשי להמתין ולראות את הגישה במשך עשרות שנים.

באופן אישי אני דווקא מקווה שהגעתו של סמן ביולוגי מקובל להזדקנות תורם רבות להורדת רמת הונאה ומידע שגוי שנשפך מהשוק ה"אנטי אייג'ינג ". תמיד יש מישהו שמנסה למכור שקר להמונים, וזה מצער שהקולות שלהם כל כך הרבה יותר גבוהים מאלו של הקהילה המדעית. בהתחשב בכך ששום דבר שנמכר היום בשוק לא יזיז את המחט בכלל על תוחלת חיי האדם, ועדיין לא הוכח ששום דבר תואם אפילו את היתרונות של הגבלת קלוריות או פעילות גופנית, אני מצפה לדרך להדגים זאת באופן חד משמעי.

בכל מקרה, בשנים האחרונות מדידת דפוסי מתילציה של DNA הראתה הבטחה כסמן ביולוגי פוטנציאלי להזדקנות. מתילציה של DNA היא חלק מתהליך השינויים האפיגנטיים המתרחשים בתגובה לנסיבות, המשנים את רמות החלבונים המיוצרים על ידי תאים. הביולוגיה שלנו היא בעצם מכלול של מכונות נוזל בהן מתגי השליטה והמנופים הם רמות החלבונים השונים במחזור הדם. הכל מגיב לכל השאר, בריקוד מורכב שלעולם לא נח של לולאות משוב חופפות בכל רמה. אולם מכאן צומחים דפוסים. ההזדקנות עוברת דרך דומה בגדול לכולנו, ולכן יש כמה תגובות דומות בגדול לנזק שלה בתאים שלנו. החוכמה היא שיש מספיק כוח חישובי והכלים הנכונים של ביוטכנולוגיה כדי להיות מסוגלים לשלוף את הדפוסים האלה מאלפי הווריאציות הלא קשורות במתילציה של DNA שקיימות בכל הרקמות שלנו.

זהו מאמר מדעי פופולרי, אך עדיין יש בו מידע מעניין על התנהלות העניינים בגישת מתילציית ה- DNA ליצירת סמן ביולוגי של הזדקנות שעשוי להיות שימושי כמדד ליעילות הטיפולים העתידיים להזדקנות:

השעון של הורבט יוצא מהאפיגנטיקה, המחקר של שינויים כימיים ומבניים שנעשו בגנום שאינם משנים את רצף ה- DNA, אך מועברים כאשר התאים מתחלקים ויכולים להשפיע על אופן ביטוי הגנים. ככל שהתאים מזדקנים, דפוס השינויים האפיגנטיים משתנה, ונראה שחלק מהשינויים מסמנים את הזמן. כדי לקבוע את גיל האדם, חורבט בוחנת נתונים על מאות עמדות רחוקות על דנ"א ממדגם של תאים ומציינת באיזו תדירות עמדות אלה מתילטות - כלומר, מצורפת קבוצת מתיל.

הוא גילה אלגוריתם, המבוסס על מצב המתילציה של קבוצה של עמדות גנומיות אלה, המספק הערכת גיל מדויקת להפליא - לא של התאים, אלא של האדם שהתאים מאכלסים. תאי דם לבנים, למשל, שעשויים להיות בני כמה ימים או שבועות בלבד, יישאו את חתימתו של התורם בן ה-50 ממנו הגיעו, פלוס מינוס כמה שנים. אותו דבר לגבי DNA המופק ממקל לחיים, המוח, המעי הגס ואיברים רבים אחרים. זה מייחד את השיטה מבדיקות המסתמכות על סמנים ביולוגיים של גיל הפועלים ברקמה אחת או שתיים בלבד, כולל הליך ההיכרויות הסטנדרטי בזהב, גזירת חומצה אספרטית, המנתחת חלבונים הננעלים לכל החיים בשן ובעצם.

אחרים החלו להוריד את תוכנית השעון האפיגנטי מהאתר של הורוואת' כדי לבדוק אותה על הנתונים שלהם. מרקו בוקס במרכז הרפואי האוניברסיטאי אוטרכט בהולנד החיל אותו על דגימות דם שנאספו מ -96 ותיקי המלחמה ההולנדים באפגניסטן בגילאי 18 עד 53. המתאם בין הגילאים הצפויים והאמיתיים עמד על 99.7%, כאשר הטווח החציוני נמדד בחודשים . ב- Zymo Research, חברת ביוטכנולוגיה באירווין, קליפורניה, תהו ווי גו וקווין בריאנט האם התוכנית תעבוד על קבוצה של דגימות שתן שזימו אסף מ -11 גברים ונשים בגילאים 28 עד 72. המתאם היה 98%, עם טעות תקן של 2.7 שנים בלבד.

[חוקרים] מצפים שהשימוש המעניין ביותר בשעון יהיה לזהות 'האצת גיל': אי התאמה בין הגיל האפיגנטי והכרונולוגי של אדם, בכללי או בחלק מסוים בגופו. הורוואת' אומר שעבודה אחרונה גילתה שאנשים עם HIV שיש להם עומס נגיפי שניתן לזהות נראים מבוגרים יותר, אפיגנטית, מאנשים בריאים או כאלה עם HIV שדיכאו את הנגיף. מחקר אחר, שטרם פורסם, קובע כי רקמות מסוימות מראות האצת גיל משמעותית בקרב אנשים שמנים חולניים.

חיבור קצר וטוב. תודה רבה על שהקדשת מזמנך לכתוב את אלה ולהפיץ מידע זה.

הפרופ 'שלי, שעוסק בתחום הסמנים הביולוגיים של ההזדקנות, אמר לי שמתאם כה גבוה אינו טוב לסמן ביולוגי של הזדקנות. הסמן הביולוגי לא היה מנבא את הגיל הביולוגי, אלא את הגיל הכרונולוגי.


חישוב גיל באמצעות DNA

איך היית מגיב אם הייתי אומר לך שאני יכול לחשב את גילך אם אקח דגימה מדמך?

כל יום התאים שלנו נחשפים לסוכנים מזיקים שעלולים לגרום לשינויים מזיקים אשר מצטברים לאורך זמן ומובילים למחלות הקשורות להזדקנות כגון סרטן. כימות השינויים הללו אפשרה למדענים לפתח מודלים המחשבים את הגיל הביולוגי של האדם, מדד ל"רווחתם "של התאים שלהם.

שעון הורבט הוא אחד משעוני הגיל הנפוצים ביותר ומשתמש בנתוני מתילציה של DNA לחישוב גיל (Horvath S, Genome Biology, 2013). מתילציה של DNA היא סוג של שינוי אפיגנטי המתייחס להוספת קבוצות ספציפיות הנקראות קבוצות מתיל על DNA באתרים ספציפיים. מצב המתילציה של ה- DNA תורם לשאלה האם גנים מסוימים מופעלים או כבים, בדומה להערות שלאחר זה בספר מתכונים המכוון אותך למתכונים שתרצה לפתוח בעתיד הקרוב! כל אתר מתילציה יכול להיות מתילט או לא מתיל ולכן יכול להיחשב כמספר - 1 עבור מתילציה ו-0 עבור ללא מתיל. The Horvath clock makes use of this and uses the pattern of methylation across someone’s DNA to extract the pattern of 1s and 0s. Across the whole of someone’s DNA, the methylation pattern can be written as a code of sequence of 1s and 0s and fed into a computer. The computer can then compare the actual sequence with patterns from the very start of life and patterns from people at various stages of life. An algorithm can then try to calculate the likely biological age of a person by fitting the changes observed in their case into the pattern we see from other people.

The Horvath clock works surprisingly well, on average calculating age to within 3 years of a person’s real age. It is not entirely understood what the clock measures, as it does not relate to a person’s biological age but to chronological age. Usually cells keep track of age through the number of times they divide, however, the Horvath clock also works for non-dividing cells such as neurons!

One might wonder what the use of age clocks may be if a person can simply be asked for their age. One use is in forensics, e.g. to predict age at crime scenes. Studying the methylation sites involved in ageing also allows us to understand the ageing process and develop and test anti-ageing interventions. More recently, DNA methylation has even been used to predict time to death! (Horvath et al Aging, 2016) In terms of application to cancer, an important aspect of methylation age is the discrepancy between a person’s methylation age and real age. The greater this difference, i.e. the “age acceleration” of a person, the greater their risk of developing ageing-related diseases and this includes cancer. Thus, this measure represents a potentially important implication to cancer risk stratification and earlier diagnoses.

Age clocks are an example of what can be achieved when experts from different fields work together. In this case exploring the methylation pattern requires both biologists, statisticians, and computer scientists to work together. The future is all about such interdisciplinary work.


First genome methylation mapping in fruit fly

A group of scientists from Children's Hospital Oakland Research Institute and UC Berkeley report the first mapping of genome methylation in the fruit-fly Drosophila melanogaster in their paper "Genome methylation in D. melanogaster is found at specific short motifs and is independent of DNMT2 activity," published this month in Genome Research.

This paper represents a major advance in the study of DNA methylation in insects. No previous study has succeeded in pinpointing the location of DNA methylation in the fly genome. The common opinion in the field was that the fly does not have genomic methylation. But Drs. Sachiko Takayama and Joseph Dhahbi, co-first authors who carried out the key work, and Drs. David Martin and Dario Boffelli, who led the project, found otherwise. The authors were able to detect genomic methylation in the fly by solving the main technical hurdle: fly methylation is relatively rare, and they developed a sensitive method that allowed them to detect it.

Why is this finding important? Methylation is a stable chemical modification of the genome in humans and other vertebrates it participates in controlling when and where genes are on and off, but its functions in other organisms are not understood. The finding suggests that genome methylation may have a hitherto uncharacterized function. While the authors still do not know what genome methylation does in the fly, they were able to find that the DNA sequence patterns that associate with methylation are very different from the patterns seen in humans, or in other animal or plant species to date.

Drosophila is one of the classic model organisms, with very well established tools to study its biology. The researchers' description of methylation in the fly will facilitate the use of this powerful experimental system to study methylation. Drosophila has only one known enzyme that could establish DNA methylation, and the researchers show that this enzyme is not responsible for the methylation patterns they detected. The fly genome has been studied very deeply, but the finding suggests that a new enzyme lies undiscovered within it.


Mechanisms of Aberrant CpG Island Methylation

Genome-wide studies are also revealing the relationships between the DNA methylomes of different tumor types. Tumors derived either from different tissues or from the same tissue, but with different histology, exhibit unique methylation profiles (19, 24-26). Despite the considerable variation among tumors, a subset of CpG islands are frequently methylated in multiple tumor types (19, 26). One recent study found that while approximately 40% of hypermethylation events occurred in only one tumor-type, more than 10% were methylated in at least 50% of tumor types (26). Thus, it appears that one mechanism driving the hypermethylation of some CpG islands is an inherently elevated susceptibility to דה נובו methylation. However, it remains unclear what contributes to this susceptibility. Several mechanisms, centering around two basic themes, have been proposed: selective advantage and selective targeting. The selective advantage hypothesis posits that aberrant DNA hypermethylation begins with random seeding of DNA methylation throughout the genome, perhaps resulting from deregulation of the DNA methylation machinery. Those methylation events occurring within the promoters of genes that function to limit cell survival and proliferation (i.e. tumor suppressor genes) are then selected for during tumor progression. Support for this hypothesis was recently provided by mouse models of cancer in which MYC over-expression was coupled with inactivation of Pten, Trp53, או E2f2 (27). Nearly 4 dozen CpG islands were found to exhibit late-stage differential methylation that occurred in a genotype-specific manner. Since the different genotypes generate unique selective pressures, it can be argued that these genotype-specific methylation events resulted from the outgrowth of cells that harbored advantageous hypermethylation events. However, since not all hypermethylated genes confer a growth or survival advantage, and many are not expressed in normal tissues, selective advantage can not be the only mechanism.

The second hypothesis suggests that hypermethylation results from the aberrant targeting of DNMTs to certain regions and/or that these regions possess intrinsic, cis-acting features that make them better substrates for דה נובו DNA methylation. An example of a specific עָבָר-acting factor that might target methylation is the oncogenic fusion protein PML-RAR which is capable of directing דה נובו DNA methylation to its target genes (28). On the other hand, the hypothesis that cis-acting mechanisms play a role in the targeting of DNA methylation is supported by the findings that hypermethylated genes tend to cluster in the genome (29, 30) and that they exhibit common sequence signatures (30-33). Several approaches have been utilized to identify cהוא-acting DNA sequences that might contribute to methylation susceptibility. First, the DNA methylation machinery has been found to have a target site preference that extends at least 4bp 5’ and 3’ of the CpG site (34). בַּמַבחֵנָה validation experiments demonstrated a 500-fold difference in the methylation rates of preferred substrates (e.g. CTTA CG CAAG) compared to non-preferred substrates (e.g. TGTT CG GTGG) (34). A related approach utilizing massively parallel sequencing of bisulfite modified DNA from leukemia and lymphoma samples identified a 30bp motif that was capable of predicting methylation susceptibility for CpG dinucleotides with up to 75% accuracy in cross-validation studies (35). Second, several groups, including ours, have utilized pattern recognition and/or motif elicitation to discover DNA sequence signatures of CpG dinucleotides or CpG islands with increased susceptibility to DNA methylation, both in normal or cancer cells (30-33). Despite the identification of several sequences that correlate with methylation susceptibility, the specific functions of these patterns remain unknown. Additionally, little consensus exists between the patterns identified by different groups, which likely results from the use of different datasets and varied computational approaches. Similar analyses of CpG islands resistant to hypermethylation have identified motifs that correlate with zinc-finger transcription factor binding (36) and, perhaps unexpectedly, with Alu repetitive elements (33). Identification of these sequence signatures has permitted the development of classification algorithms which predict the methylation status of CpG islands either in normal cells (31, 37), a cell culture model of דה נובו methylation (32, 33), or cancer cells (38, 39). Through further pattern recognition and supervised learning approaches, we may discover additional features of CpG islands that regulate methylation susceptibility.


DNA Methylation and Cancer Research

DNA methylation is one of the most common and most studied epigenetic processes, which alters gene expression without changing the DNA sequence. Within the mammalian genome, methylation of cytosine at the fifth position (Figure 1) is mechanistically understood and is mainly limited to cytosine (C) and guanine (G) rich regions, termed CpG islands. These islands are frequent in the promoters of transcription start sites, which are DNA regions that initiate transcription of the associated gene. In particular, CpG islands are prevalent for housekeeping genes, important for regular cellular functions. Hypermethylation, an increase in methylation relative to normal, of CpG islands silences gene expression and the opposite is also true hypomethylation promotes gene expression. Methylation status of DNA varies on both a spatial and temporal scale, with changes seen due to age, tissue type, and environmental interactions. Thus, DNA methylation analysis can help researchers gain valuable insight into gene regulation and development.

Figure 1. DNA methylation. A methyl group addition to the cytosine carbon 5 in cytosine-phosphate-guanine (CpG) and other nucleotide sequences inhibits the binding of transcription factors to promoters.

Aberrant DNA methylation is implicated in many disease processes, including cancer, obesity, and addiction. Studies have shown that DNA methylation occurs very early in cancer development and may contribute to tumorigenesis, as well as disease progression (1). DNA hypermethylation may directly silence genes that act as tumor suppressors and are involved in processes that are important in cancer development. For example, the SEPT9 gene encodes for the septin-9 protein, which is involved in cytokinesis during the cell division process and is also thought to be a tumor suppressor. Hypermethylation may also indirectly inactivate tumor-associated genes by silencing important transcription factors or by affecting DNA repair.

DNA hypomethylation and the resulting increase in gene expression may result in tumorigenesis due to the activation of growth-promotion genes such as R-Ras in gastric cancer. Hypomethylation can also occur in other types of genomic elements, such as repetitive regions and transposons. This may lead to an increase in genomic instability and chromosomal rearrangements that result in cancer (Table 1).

Cancer type

Demethylated repeat sequences

Table 1. DNA hypomethylation of repetitive sequences and associated cancer types. Adapted from Ref 1.

With appropriate assay design and validation, DNA methylation may be used as a biomarker to support clinical decisions in various cancers (2). For example, the U.S. Food and Drug Administration (FDA) has approved DNA methylation assays for the screening of colorectal cancer (3,4).

DNA methylation has several advantages as a biomarker in healthcare applications (2,5). First, alterations of DNA methylation occur at higher percentages in cancer than genetic variations, resulting in higher sensitivity for methylation studies. DNA hypermethylation only occurs in promoter regions at CpG islands. This allows one to focus on a specific and small genetic region of interest. DNA methylation is binary, i.e., a nucleotide is either methylated or not methylated, enabling reliable measurements for a biomarker assay. DNA methylation patterns are also robust. Thus, DNA methylation analysis can be performed on a variety of samples, including ones that are heterogeneous or degraded. Fresh-frozen and formalin-fixed paraffin-embedded (FFPE) tissues that are stored long term can be analyzed for methylation biomarkers. Analysis of peripheral blood samples is also possible, enabling noninvasive testing for cancer.

Due to its dynamic nature, the "methylome" as it is known, is much more variable than the genome and is inherently more complex. The advent of NGS and the ability to perform a massively parallel analysis of the methylome has enabled researchers to obtain a comprehensive, unbiased, and quantitative view of the methylation landscape at single base pair resolution. NGS allows researchers to rapidly sequence millions of DNA molecules. Each DNA sequence can be counted and quantified, instead of previous methylation analysis approaches that looked at relative measurements between samples. The high sensitivity and specificity of NGS also enables researchers to identify novel epigenetic biomarkers.

To capture genome-wide information on DNA methylation, a variety of methods have evolved over time. This includes bisulfite conversion, digestion with methylation-sensitive restriction enzymes, and antibody- or 5-methylcytosine binding protein–based purification of methylated DNA (Table 2). Affinity enrichment-based methods, as the name implies, utilize proteins that naturally bind to methylated DNA to help isolate the desired genetic material. The unmethylated DNA is washed away and the enriched portion is subsequently amplified and prepared for analysis. Although this method is cost effective, enrichment-based methods are clearly biased towards regions that are hypermethylated. Affinity enrichment also does not capture which nucleotides are actually methylated.

  • Cost-effective
  • No mutations introduced
  • Bias towards hypermethylated regions
  • Inability to predict absolute methylation level

Regions without enzyme restriction site are not covered

  • Higher costs
  • Higher DNA input unless a targeted approach is taken
  • DNA degradation after treatment

Table 2. Comparison of genome-wide approaches for DNA methylation profiling. Adapted from Ref 6.

Certain restriction enzymes, such as MspI, are sensitive to DNA methylation and will cleave their recognition site if it is methylated. The opposite is also true, with certain enzymes not cleaving their recognition site if it is methylated. Thus, DNA methylation can be elucidated to single base pair resolution by using a combination of enzymes to isolate methylated or unmethylated sequences for analysis. Although simple to perform, the use of restriction enzymes means analysis is isolated to only those genomic regions that have the appropriate restriction sites.

Bisulfite treatment is widely considered the leading method for genome-wide methylation profiling. Treatment of DNA with bisulfite (HSO3 - ) converts cytosines to uracil, but 5-methylcytosines are left unchanged. These specific changes can be analyzed to provide single nucleotide resolution across the genome, revealing differences in methylation between complementary strands and alleles. NGS throughput and accuracy can be leveraged to analyze and quantify all of this information about the methylome using the appropriate bioinformatics tools.

While capable of being the most informative method, bisulfite treatment can be prohibitive from a cost and sample input perspective if one is studying the entire human genome. A targeted approach by focusing only on genomic regions of interest can help alleviate these concerns and as noted, may actually be of benefit when one’s focus is on biomarker development in cancer research studies and improving clinical decision making. Other benefits of targeted methylation sequencing include increasing sequencing coverage levels and reducing data analysis complexity by only looking at specific areas of the genome. Increasing the number of samples that can be sequenced and analyzed simultaneously is also possible.

To learn more about targeted sequencing approaches and why coverage is important, explore the NGS basics learning center articles.