Точные данные можно найти в сточных водах

Блог

ДомДом / Блог / Точные данные можно найти в сточных водах

Jan 26, 2024

Точные данные можно найти в сточных водах

Исследования лаборатории Фанцюн Линя в Вашингтонском университете в Сент-Луисе

Исследования, проведенные в лаборатории Фанцюн Лина в Вашингтонском университете в Сент-Луисе, показали ранее в этом году, что количество SARS-CoV-2 в системе сточных вод коррелирует с бременем заболевания — COVID-19 — в регионе, который она обслуживает.

Но прежде чем эта работа могла быть выполнена, Лингу нужно было знать: как можно определить количество особей, представленных в случайной выборке сточных вод?

Случайная встреча с коллегой помогла Лингу, доценту кафедры энергетики, экологии и химической инженерии Инженерной школы Маккелви, разработать модель машинного обучения, которая использовала набор микробов, обнаруженных в сточных водах, чтобы выяснить, сколько отдельных людей они представляли. В дальнейшем этот метод сможет связать другие свойства сточных вод с данными индивидуального уровня.

Исследование было опубликовано в журнале PLOS Computational Biology.

Проблема была простой: «Если вы возьмете только одну мерную ложку сточных вод, вы не будете знать, сколько людей вы измеряете», — сказал Линг. Это противоречит тому, как обычно проводятся исследования.

«Обычно, когда вы планируете эксперимент, вы определяете размер выборки и знаете, сколько людей вы измеряете», — сказал Линг. Прежде чем она смогла найти корреляцию между SARS-CoV-2 и количеством людей с COVID, ей пришлось выяснить, сколько людей было представлено в воде, которую она тестировала.

Первоначально Линг думал, что машинное обучение сможет выявить прямую связь между разнообразием микробов и количеством людей, которых они представляют, но моделирование, выполненное с помощью «готового» машинного обучения, не увенчалось успехом. .

Затем Линг случайно встретился с Ликаем Ченом, доцентом кафедры математики и статистики факультета искусств и наук. Они поняли, что у них общий интерес к работе с новыми и сложными данными. Линг упомянула, что работает над проектом, в котором Чен, возможно, сможет внести свой вклад.

«Она поделилась со мной проблемой, и я сказал, что мы действительно можем это сделать», — сказал Чен. Случилось так, что Чен работал над задачей, в которой использовался метод, который Линг тоже нашел полезным.

Ключ к возможности определить, сколько отдельных людей было представлено в выборке, связан с тем фактом, что чем больше выборка, тем больше вероятность того, что она будет напоминать среднее или среднее значение. Но на самом деле люди не склонны быть «средними». Следовательно, если образец выглядит как средний образец микробиоты, он, скорее всего, состоит из многих людей. Чем дальше от среднего значения, тем больше вероятность того, что оно представляет личность.

«Но сейчас мы имеем дело с многомерными данными, верно?» - сказал Чен. Существует почти бесконечное количество способов группировки этих разных микробов для формирования образца. «Значит, это означает, что нам нужно выяснить, как нам объединить эту информацию из разных мест?»

Используя эту базовую интуицию и много математических вычислений, Чен работал с Лингом над разработкой более адаптированного алгоритма машинного обучения, который мог бы, если его обучить на реальных образцах микробиоты более чем 1100 человек, определить, сколько людей было представлено в образце сточных вод ( эти выборки не были связаны с обучающими данными).

«Это намного быстрее, и этому можно обучаться на ноутбуке», — сказал Линг. И это не только полезно для микробиома, но также, при наличии достаточного количества примеров — обучающих данных — этот алгоритм может использовать вирусы из вирома человека или метаболические химические вещества, чтобы связать людей с образцами сточных вод.

«Этот метод использовался для проверки нашей способности измерять численность населения», — сказал Линг. Но дело идет гораздо дальше. «Сейчас мы разрабатываем структуру, позволяющую проводить валидацию в ходе исследований».

Инженерное дело

Здравоохранение

Научная технология

Искусство и науки

Прочтите больше историй из журнала Arts & Sciences

Посетите искусство и науки

Инженерная школа МакКелви

Прочтите больше историй из Инженерной школы МакКелви