Microsoft розробила новий метод запису та читання інформації у форматі ДНК
Метод запису та читання інформації у форматі ДНК (фото: microsoft.com) |
Поточні оцінки Міжнародної корпорації даних вказують на зростання попиту на зберігання даних на 20,4% у порівнянні з минулим роком, який, за прогнозами, досягне майже 9 зеттабайт до 2024 року . Щоб представити цю цифру в перспективі, Windows 11, яка спочатку займає близько 64 гігабайт пам’яті, потрібно буде встановити на понад 15 мільярдів пристроїв, щоб додати лише 1 зеттабайт використовуваного сховища. Для порівняння, за оцінками, з 2011 року по всьому світу було продано трохи більше 3 мільярдів персональних комп’ютерів .
Доступні методи зберігання мають складнощі в довгостроковій перспективі встигнути за зростаючим попитом. Синтетична ДНК, по суті, крихітний накопичувач інформації, пропонує потенційний шлях до значного зменшення обсягу простору та матеріалу, необхідного для майбутніх потреб архівного зберігання. Повертаючись до прогнозу зростання, наведеного вище, нам знадобляться мільйони картриджів із стрічкою — нині найщільніших комерційних носіїв інформації — для зберігання 9 зеттабайт інформації, в той час як це займе відбиток одного маленького холодильника, якщо воно зберігається в ДНК.
ДНК не тільки пропонує явну перевагу перед існуючими носіями зберігання з щільністю понад 1 ексабайт на кубічний дюйм, але також є потенційним рішенням сучасних проблем у системах зберігання архівів даних. ДНК може бути неймовірно міцною і може прослужити тисячі років, на відміну від стрічки, яку потрібно переписувати кожні 30 років у кращому випадку. Зберігання даних ДНК не застаріє, оскільки методи зчитування молекул ДНК є численними і актуальними для додатків в галузі науки про життя. Крім того, дані вказують на те, що зберігання ДНК може мати менші викиди парникових газів, споживання води та енергії . Незважаючи на ці переваги, однією з ключових перешкод для широкомасштабного розгортання зберігання даних ДНК була низька пропускна здатність синтезу ДНК, що призводить до низької пропускної здатності запису та відносно високої вартості.
Ми співпрацюємо з нашими співробітниками Вашингтонського університету в Лабораторії молекулярних інформаційних систем (MISL), щоб вирішити цю проблему. Наша стаття, опублікована в Science Advances , « Масштабування зберігання даних ДНК за допомогою нанорозмірних електродних ям », представляє підтверджений концепцією молекулярний контролер у вигляді крихітного механізму запису сховища ДНК на чіпі. Чіп демонструє здатність упаковувати плями синтезу ДНК на три порядки більш щільно, ніж раніше. Це показує, що можна досягти набагато більшої пропускної здатності запису ДНК.
У цій публікації в блозі ми обговоримо процеси запису/читання зберігання ДНК, досягнення нашої роботи, щоб показати, що пропускна здатність запису може збільшитися для більш поширених потреб у сховищах, а також технологію, яку ми створили для досягнення цього досягнення, включаючи нанорозмірний електрохімічний масив. . Зрештою, ми змогли використати систему для кодування повідомлення на чотирьох ланцюгах синтетичної ДНК, що є доказом того, що нанорозмірне запис ДНК можливий у розмірах, необхідних для практичного зберігання даних ДНК.
Запис і читання синтетичної ДНК означає переклад бітів у молекули і назад
Останнім часом було проведено багато роботи, щоб розширити потенційні масштаби зберігання ДНК, наприклад, розробити методи автоматизації, щоб уникнути трудомісткого процесу введення вручну піпетування ДНК та інших реагентів або методів захисту ДНК для тривалого зберігання понад тисячі років. Ми вже провели дослідження в ряді областей зберігання даних ДНК, включаючи наскрізну систему зберігання даних з довільним доступом і життєздатні методи збереження ДНК.. Зберігання інформації в ДНК у масштабі, необхідному для комерційного використання, вимагає двох важливих процесів. Перший вимагає перекладу цифрових бітів (одиниць і нулів) у ланцюги синтетичної ДНК, що представляють ці біти, за допомогою програмного забезпечення для кодування та синтезатора ДНК. Другий — зчитувати та декодувати інформацію назад у біти, щоб знову відновити цю інформацію в цифрову форму за допомогою секвенсора ДНК та програмного забезпечення для декодування.
Для зберігання даних про синтетичну ДНК цифрові біти кодуються в основах ДНК (A, C, T і G) послідовності ДНК. Коли дані зберігаються в ДНК, необхідно синтезувати ланцюг ДНК, що містить певну послідовність основ (див. рис. 1). Ланцюги ДНК традиційно створюються за допомогою багатоетапної техніки, яка називається хімією фосфорамідитів. У цьому процесі ланцюг ДНК вирощується шляхом послідовного додавання основ ДНК. Кожна основа ДНК містить блокуючу групу, яка запобігає багаторазовому додаванню основи до зростаючого ланцюга ДНК. Після того, як заблокована основа приєднується до ланцюга ДНК, кислота доставляється, щоб розщепити блокуючу групу і підготувати ланцюг ДНК для додавання наступної основи.
Синтез ланцюгів ДНК можна виконувати окремо або паралельно на масиві, який містить кілька місць, де можна одночасно створювати унікальні послідовності ДНК. Збільшення щільності синтезу, тобто кількості плям синтезу на фіксованій ділянці, є ключем до збільшення пропускної здатності запису та зниження його вартості. Чим ближче один до одного ці точки на масиві, тим нижча вартість синтезу кожного ланцюга ДНК, оскільки матеріали, необхідні для процесу, можна використовувати з більшою кількістю послідовностей.
Електрохімічні масиви відкривають двері для нанорозмірних розмірів
Основна проблема для збільшення пропускної здатності запису ДНК полягає в тому, щоб підтримувати контроль над окремими плямами, не заважаючи сусіднім плямам. Сучасні масиви синтезу ДНК розроблені для створення невеликої кількості високоякісних послідовностей ДНК з мільйонами точних копій і досягаються за допомогою трьох основних методів синтезу масивів: фотохімії, осадження рідиною та електрохімії.
У фотохімічному синтезі ДНК фотомаска або мікродзеркало створює світлові візерунки на масиві, що видаляє блокуючу групу з ланцюга ДНК. Рідке осадження, таке як акустичний або струменевий друк, доставляє кислотний блок на окремі плями. Однак обидва методи обмежені в щільності синтезу, яку вони можуть досягти через розмір мікродзеркала, світлорозсіювання або стабільність крапель. Проте електрохімічні масиви можуть використовувати план напівпровідників, де звичайні розміри елементів 7 нанометрів (нм).
При електрохімічному синтезі ДНК кожна пляма в масиві містить електрод. Після подачі напруги на аноді (робочому електроді) утворюється кислота для розблокування зростаючих ланцюгів ДНК, а на катоді (контрелектроді) утворюється еквівалентна основа. Основною проблемою при зменшенні кроку між анодами є дифузія кислоти; чим менший крок, тим легше може бути для кислоти дифундувати до сусідніх електродів і викликати ненавмисне розблокування в цих місцях. Хоча комерційні електрохімічні масиви продемонстрували утворення кислоти та мінімальну дифузію на електродах мікронного розміру, було неясно, чи ця тенденція триватиме нескінченно до менших елементів.
Наші колеги з MISL моделювали генерацію кислоти при малих розмірах властивостей, використовуючи кінцевий елементний аналіз, щоб визначити, чи буде ця тенденція зберігатися. Ми прийняли макет дизайну, який містить електрод 650 нм, вбудований у скляний колодязь, оточений катодами. Скляний колодязь служив би поверхнею кріплення для зростання ланцюгів ДНК і фізичним бар’єром для запобігання дифундації кислоти до сусідніх ділянок. Як додатковий буфер, будь-яка кислота, яка втекла з свердловини, зустрінеться з основою, що утворюється на катодах, і буде нейтралізована. Модель припускала, що кислота може бути обмежена в цих і навіть менших масштабах, заохочуючи нас до розробки чіпів, які містять невеликі елементи, і до їх виготовлення.
Щоб застосувати теорію на практиці, у нас були виготовлені масиви мікросхем за вищезгаданим макетом. Ці електрохімічні масиви містили набори з чотирьох індивідуально адресованих електродів. За допомогою них ми продемонстрували здатність контролювати синтез ДНК у потрібних місцях, проводячи експерименти з двома флуоресцентно міченими основами (зеленою та червоною). Якби кислота несподівано поширювалася, вона досягала б ненавмисних плям, і ми б побачили, що один колір розливається над іншими плямами.
На електрохімічному масиві ми створили кислоту на одному наборі електродів, щоб розблокувати ланцюг ДНК, а потім додали зелено-флуоресцентну основу. На наступному кроці ми створили кислоту на іншому наборі електродів того ж масиву та підключили червоно-флуоресцентну основу, щоб створити зображення, показане на малюнку 3. Як і очікувалося, ми не побачили кровотечі, що підтверджує, що не було ненавмисної дифузії кислоти. .
Потім на окремому масиві ми продемонстрували здатність масиву записувати дані шляхом синтезу чотирьох унікальних ланцюгів ДНК, кожна довжиною 100 основ, що кодувало девіз «Надання можливості кожній людині зберігати більше!» Хоча показники помилок були вищими, ніж у комерційних синтезаторів ДНК, ми все одно могли декодувати повідомлення без бітових помилок
Шлях вперед для нанорозмірних молекулярних контролерів
Наше підтвердження концепції прокладає шлях до створення величезної кількості унікальних послідовностей ДНК паралельно для зберігання даних. Вводячи електрони в певні місця, ми можемо контролювати молекулярне середовище, що оточує електроди, і таким чином контролювати послідовність вирощеної там ДНК. Природним наступним кроком є вбудовування цифрової логіки в чіп, щоб дозволити індивідуально контролювати мільйони електродних плям, щоб записувати кілобайти в секунду даних в ДНК. З цього моменту ми передбачаємо, що технологія досягне масивів, що містять мільярди електродів, здатних зберігати мегабайти даних в секунду в ДНК. Це значно наблизить продуктивність зберігання даних ДНК і вартість до стрічки. Ми вітаємо подальші дискусії для повної реалізації більш широко доступних молекулярних контролерів у майбутньому.
У нашій роботі використовувалася хімія фосфорамідиту, яка сьогодні є стандартною в біотехнології. Однак ця хімія заснована на розчиннику на основі викопних речовин. Щоб виконати обіцянки ДНК щодо стійкості , ми очікуємо, що розчини на водній основі замінять хімію на основі викопних речовин. Ми оцінювали нові платформи ферментативного синтезу ДНК, такі як система SYNTAX від DNA Script. Ми також працюємо з Ansa Biotechnologies, щоб розробити набір ферментних реагентів, спеціально розроблених для нашого електрохімічного масиву. Нам завжди цікаво дізнатися про нові хімії та інші технології, які можуть зробити зберігання даних ДНК більш стійким.
У більш широкому плані ця робота демонструє контроль над інтерфейсом електронно-молекулярного, який, як ми вважаємо, відкриває двері для нових застосувань. Наприклад, електрохімічні методи контролю дозволяють здійснювати просторовий контроль ферментів на нанорозмірі. Крім ДНК, це також може бути інструментом для відкриття ліків, забезпечуючи швидкий комбінаторний органічний синтез як платформу для скринінгу кінетики зв’язування ліків з білком. Іншими прикладами є інструмент для аналізів, які виявляють біомаркери хвороб, або навіть платформа для виявлення забруднювачів навколишнього середовища.
Якщо ви бажаєте дізнатися більше про роботу зі збереженням ДНК, яка проводиться в Microsoft Research, перегляньте сторінку проекту DNA Storage . Ви також можете додатково вивчити, як електронно-молекулярні системи зберігають дані та можуть виконувати певні типи обчислень, на вебінарі Microsoft Research з Карін Штраус . Щоб дізнатися більше про новітню галузь зберігання даних ДНК, перегляньте сторінку Альянсу для зберігання даних ДНК ..
Пише Microsoft
Коментарі
Дописати коментар