304 ដែកអ៊ីណុក welded coiled tube / tubing zomponent zhemical, សក្តានុពលជីវសំយោគនៃមីក្រូជីវសមុទ្រសកល

សូមអរគុណសម្រាប់ការទស្សនា Nature.com ។អ្នកកំពុងប្រើកំណែកម្មវិធីរុករកតាមអ៊ីនធឺណិតដែលមានការគាំទ្រ CSS មានកំណត់។សម្រាប់បទពិសោធន៍ដ៏ល្អបំផុត យើងសូមណែនាំឱ្យអ្នកប្រើកម្មវិធីរុករកតាមអ៊ីនធឺណិតដែលបានអាប់ដេត (ឬបិទមុខងារភាពឆបគ្នានៅក្នុង Internet Explorer)។លើសពីនេះទៀត ដើម្បីធានាបាននូវការគាំទ្រជាបន្តបន្ទាប់ យើងបង្ហាញគេហទំព័រដោយគ្មានរចនាប័ទ្ម និង JavaScript។
គ្រាប់រំកិលបង្ហាញអត្ថបទបីក្នុងមួយស្លាយ។ប្រើប៊ូតុងខាងក្រោយ និងបន្ទាប់ដើម្បីផ្លាស់ទីតាមស្លាយ ឬប៊ូតុងឧបករណ៍បញ្ជាស្លាយនៅចុងបញ្ចប់ដើម្បីផ្លាស់ទីតាមស្លាយនីមួយៗ។

ការពិពណ៌នាលំអិតនៃផលិតផល

304 ដែកអ៊ីណុក welded coiled tube / tubing
1. ការបញ្ជាក់: បំពង់ដែកអ៊ីណុក / បំពង់
2. ប្រភេទ: welded ឬគ្មានថ្នេរ
3. ស្តង់ដារ: ASTM A269, ASTM A249
4. បំពង់ដែកអ៊ីណុក OD: 6mm ទៅ 25.4MM
5. ប្រវែង: 600-3500MM ឬតាមតម្រូវការរបស់អតិថិជន។
6. កម្រាស់ជញ្ជាំង: 0.2mm ទៅ 2.0mm ។

7. ការអត់ធ្មត់: OD: +/-0.01mm;កម្រាស់: +/- 0.01% ។

8. ទំហំរន្ធខាងក្នុងរបស់ Coil: 500MM-1500MM (អាចលៃតម្រូវបានតាមតម្រូវការអតិថិជន)

9. កម្ពស់ Coil: 200MM-400MM (អាចលៃតម្រូវបានតាមតម្រូវការរបស់អតិថិជន)

10. ផ្ទៃ: ភ្លឺឬ annealed
11. សម្ភារៈ: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, យ៉ាន់ស្ព័រ 625, 825, 2205, 2507 ជាដើម។
12. ការវេចខ្ចប់៖ ថង់ត្បាញក្នុងប្រអប់ឈើ បន្ទះឈើ ឈើប្រណិត ឬតាមតម្រូវការរបស់អតិថិជន
13. តេស្តៈ សមាសធាតុគីមី កម្លាំងទិន្នផល កម្លាំង tensile ការវាស់វែងភាពរឹង
14. ការធានា៖ ការត្រួតពិនិត្យភាគីទីបី (ឧទាហរណ៍៖ SGS TV) ការត្រួតពិនិត្យ។ល។
15. កម្មវិធី៖ ការតុបតែង គ្រឿងសង្ហារិម ការដឹកជញ្ជូនប្រេង ឧបករណ៍ផ្លាស់ប្តូរកំដៅ ការធ្វើផ្លូវដែក ការផលិតក្រដាស រថយន្ត កែច្នៃអាហារ វេជ្ជសាស្ត្រ។ល។

សមាសធាតុគីមី និងលក្ខណៈសម្បត្តិរូបវន្តទាំងអស់សម្រាប់ដែកអ៊ីណុកដូចខាងក្រោម៖

សម្ភារៈ សមាសធាតុគីមី ASTM A269 % អតិបរមា
C Mn P S Si Cr Ni Mo NB Nb Ti
TP304 0.08 2.00 ០.០៤៥ 0.030 1.00 18.0-20.0 8.0-11.0 ^ ^ ^ ។ ^
TP304L ០.០៣៥ 2.00 ០.០៤៥ 0.030 1.00 18.0-20.0 8.0-12.0 ^ ^ ^ ^
TP316 0.08 2.00 ០.០៤៥ 0.030 1.00 16.0-18.0 10.0-14.0 2.00-3.00 ^ ^ ^
TP316L 0.035 ឃ 2.00 ០.០៤៥ 0.030 1.00 16.0-18.0 10.0-15.0 2.00-3.00 ^ ^ ^
TP321 0.08 2.00 ០.០៤៥ 0.030 1.00 ១៧.០-១៩.០ 9.0-12.0 ^ ^ ^ 5C -0.70
TP347 0.08 2.00 ០.០៤៥ 0.030 1.00 ១៧.០-១៩.០ 9.0-12.0 10C -1.10 ^

 

សម្ភារៈ ការព្យាបាលកំដៅ សីតុណ្ហភាព F (C) អប្បបរមា។ ភាព​រឺ​ង
Brinell រ៉ុកវែល។
TP304 ដំណោះស្រាយ 1900 (1040) 192HBW/200HV 90HRB
TP304L ដំណោះស្រាយ 1900 (1040) 192HBW/200HV 90HRB
TP316 ដំណោះស្រាយ 1900(1040) 192HBW/200HV 90HRB
TP316L ដំណោះស្រាយ 1900(1040) 192HBW/200HV 90HRB
TP321 ដំណោះស្រាយ 1900(1040) អេហ្វ 192HBW/200HV 90HRB
TP347 ដំណោះស្រាយ 1900(1040) 192HBW/200HV 90HRB

 

OD, អ៊ីញ OD ការអត់ធ្មត់អ៊ីញ (មម) ការអត់ធ្មត់ WT % ប្រវែង Tolernace អ៊ីញ (មម)
+ -
≤ 1/2 ± 0.005 (0.13 ) ± ១៥ ១/៨ (៣.២) 0
> 1/2 ~ 1 1/2 ± 0.005(0.13) ± 10 ១/៨ (៣.២) 0
> 1 1/2 ~< 3 1/2 ± 0.010(0.25) ± 10 ៣/១៦ (៤.៨) 0
> 3 1/2 ~< 5 1/2 ± 0.015(0.38) ± 10 ៣/១៦ (៤.៨) 0
> ៥ ១/២ ~< ៨ ± 0.030(0.76) ± 10 ៣/១៦ (៤.៨) 0
៨~< ១២ ± 0.040(1.01) ± 10 ៣/១៦ (៤.៨) 0
១២~< ១៤ ± 0.050(1.26) ± 10 ៣/១៦ (៤.៨) 0

សហគមន៍អតិសុខុមប្រាណធម្មជាតិមានភាពចម្រុះផ្នែករូបវិទ្យា និងមេតាបូលីស។បន្ថែមពីលើក្រុមដែលមិនបានសិក្សានៃសារពាង្គកាយ1 ភាពចម្រុះនេះក៏មានសក្តានុពលដ៏សម្បូរបែបសម្រាប់ការរកឃើញនៃអង់ស៊ីមសំខាន់ៗតាមបែបអេកូឡូស៊ី និងជីវបច្ចេកវិទ្យា និងសមាសធាតុគីមីជីវៈ2,3។ទោះជាយ៉ាងណាក៏ដោយ ការសិក្សាពីភាពចម្រុះនេះដើម្បីកំណត់ផ្លូវហ្សែនដែលសំយោគសមាសធាតុទាំងនោះ និងភ្ជាប់ពួកវាទៅនឹងម៉ាស៊ីនរៀងៗខ្លួននៅតែជាបញ្ហាប្រឈមមួយ។សក្ដានុពលជីវសំយោគនៃអតិសុខុមប្រាណនៅក្នុងមហាសមុទ្របើកចំហនៅតែមិនទាន់ដឹងច្បាស់នៅឡើយ ដោយសារតែមានកម្រិតក្នុងការវិភាគទិន្នន័យដំណោះស្រាយហ្សែនទាំងមូលនៅលើមាត្រដ្ឋានសកល។នៅទីនេះ យើងស្វែងយល់ពីភាពសម្បូរបែប និងភាពសម្បូរបែបនៃចង្កោមហ្សែនជីវសំយោគនៅក្នុងមហាសមុទ្រ ដោយរួមបញ្ចូលហ្សែនមីក្រុបប្រហែល 10,000 ពីកោសិកាវប្បធម៌ និងកោសិកាតែមួយជាមួយនឹងហ្សែនដែលបានបង្កើតថ្មីជាង 25,000 ពីគំរូទឹកសមុទ្រជាង 1,000 ។កិច្ចខិតខំប្រឹងប្រែងទាំងនេះបានកំណត់អត្តសញ្ញាណប្រហែល 40,000 putative ភាគច្រើនជាចង្កោមហ្សែន biosynthetic ថ្មី ដែលមួយចំនួនត្រូវបានរកឃើញនៅក្នុងក្រុម phylogenetic ដែលមិនមានការសង្ស័យពីមុន។នៅក្នុងចំនួនប្រជាជនទាំងនេះ យើងបានកំណត់អត្តសញ្ញាណពូជពង្សដែលសំបូរទៅដោយចង្កោមហ្សែនជីវសំយោគ ("Candidatus Eudormicrobiaceae") ដែលជាកម្មសិទ្ធិរបស់ពពួកបាក់តេរីដែលមិនបានដាំដុះ ហើយរួមបញ្ចូលនូវអតិសុខុមប្រាណចម្រុះជីវសំយោគច្រើនបំផុតនៅក្នុងបរិយាកាសនេះ។ក្នុងចំណោមទាំងនេះ យើងបានកំណត់លក្ខណៈផ្លូវ phosphatase-peptide និង pytonamide ដោយកំណត់អត្តសញ្ញាណឧទាហរណ៍នៃរចនាសម្ព័ន្ធសមាសធាតុជីវសកម្មមិនធម្មតា និងអង់ស៊ីមវិទ្យារៀងៗខ្លួន។សរុបសេចក្តី ការសិក្សានេះបង្ហាញពីរបៀបដែលយុទ្ធសាស្ត្រផ្អែកលើមីក្រូជីវមអាចអនុញ្ញាតឱ្យការរុករកអង់ស៊ីម និងអាហារធម្មជាតិដែលមិនបានពិពណ៌នាពីមុននៅក្នុង microbiota និងបរិស្ថានដែលយល់មិនសូវច្បាស់។
មីក្រុបជំរុញវដ្តជីវគីមីវិទ្យាសកល រក្សាបណ្តាញអាហារ និងរក្សារុក្ខជាតិ និងសត្វឱ្យមានសុខភាពល្អ 5.ភាពចម្រុះផ្នែករូបវិទ្យា មេតាបូលីស និងមុខងារដ៏ធំសម្បើមរបស់ពួកគេតំណាងឱ្យសក្តានុពលដ៏សំបូរបែបសម្រាប់ការរកឃើញថ្មីនៃសារធាតុ taxa1 អង់ស៊ីម និងសមាសធាតុជីវគីមី រួមទាំងផលិតផលធម្មជាតិ 6.នៅក្នុងសហគមន៍អេកូឡូស៊ី ម៉ូលេគុលទាំងនេះផ្តល់អតិសុខុមប្រាណជាមួយនឹងមុខងារសរីរវិទ្យា និងអេកូឡូស៊ីផ្សេងៗគ្នា ចាប់ពីទំនាក់ទំនងរហូតដល់ការប្រកួតប្រជែង 2, 7 ។បន្ថែមពីលើមុខងារដើមរបស់ពួកគេ ផលិតផលធម្មជាតិទាំងនេះ និងផ្លូវផលិតកូដហ្សែនរបស់ពួកគេផ្តល់នូវឧទាហរណ៍សម្រាប់កម្មវិធីជីវបច្ចេកវិទ្យា និងការព្យាបាល2,3។ការកំណត់អត្តសញ្ញាណផ្លូវ និងការតភ្ជាប់បែបនេះត្រូវបានសម្របសម្រួលយ៉ាងខ្លាំងដោយការសិក្សាអំពីអតិសុខុមប្រាណ។ទោះជាយ៉ាងណាក៏ដោយ ការសិក្សាតាមនិយតករនៃបរិស្ថានធម្មជាតិបានបង្ហាញថា មីក្រូសរីរាង្គភាគច្រើនមិនត្រូវបានគេដាំដុះទេ។ភាពលំអៀងវប្បធម៌នេះកំណត់សមត្ថភាពរបស់យើងក្នុងការទាញយកភាពចម្រុះមុខងារដែលបានអ៊ិនកូដដោយអតិសុខុមប្រាណជាច្រើន4,9។
ដើម្បីយកឈ្នះលើដែនកំណត់ទាំងនេះ ភាពជឿនលឿននៃបច្ចេកវិទ្យាក្នុងទសវត្សរ៍កន្លងមកបានអនុញ្ញាតឱ្យអ្នកស្រាវជ្រាវដោយផ្ទាល់ (ពោលគឺដោយគ្មានវប្បធម៌ពីមុន) បំបែកបំណែក DNA អតិសុខុមប្រាណពីសហគមន៍ទាំងមូល (metagenomics) ឬកោសិកាតែមួយ។សមត្ថភាពក្នុងការប្រមូលផ្តុំបំណែកទាំងនេះទៅជាបំណែកហ្សែនធំជាងមុន និងបង្កើតឡើងវិញនូវហ្សែនដែលបានផ្គុំតាមមេតាណមច្រើន (MAGs) ឬហ្សែនពង្រីកតែមួយ (SAGs) រៀងៗខ្លួន បើកឱកាសដ៏សំខាន់មួយសម្រាប់ការសិក្សាតាមបែបពន្ធុនៃមីក្រូជីវម (ពោលគឺសហគមន៍មីក្រូជីវ និងមីក្រូជីវម)។ត្រួសត្រាយផ្លូវថ្មី។សម្ភារៈហ្សែនផ្ទាល់ខ្លួននៅក្នុងបរិយាកាសដែលបានផ្តល់ឱ្យ) 10,11,12 ។ជាការពិតណាស់ ការសិក្សាថ្មីៗបានពង្រីកយ៉ាងខ្លាំងនូវតំណាង phylogenetic នៃភាពចម្រុះនៃអតិសុខុមប្រាណនៅលើផែនដី 1, 13 ហើយបានបង្ហាញពីភាពចម្រុះមុខងារជាច្រើននៅក្នុងសហគមន៍អតិសុខុមប្រាណនីមួយៗ ដែលពីមុនមិនត្រូវបានគ្របដណ្តប់ដោយបណ្តុំហ្សែនយោងនៃអតិសុខុមប្រាណវប្បធម៌ (REFs)14 ។សមត្ថភាពក្នុងការដាក់ភាពចម្រុះមុខងារដែលមិនបានរកឃើញនៅក្នុងបរិបទនៃហ្សែនមេ (ពោលគឺដំណោះស្រាយហ្សែន) គឺមានសារៈសំខាន់សម្រាប់ការទស្សន៍ទាយថាជាបន្ទាត់អតិសុខុមប្រាណដែលមិនទាន់មានលក្ខណៈដែលសន្មតថាបានអ៊ិនកូដផលិតផលធម្មជាតិថ្មី 15,16 ឬសម្រាប់ការតាមដានសមាសធាតុទាំងនោះត្រឡប់ទៅអ្នកផលិតដើមរបស់ពួកគេ 17 ។ជាឧទាហរណ៍ វិធីសាស្រ្តវិភាគហ្សែនមេតាណម និងកោសិកាតែមួយរួមបញ្ចូលគ្នាបាននាំឱ្យមានការកំណត់អត្តសញ្ញាណរបស់ Candidatus Entotheonella ដែលជាក្រុមនៃបាក់តេរីដែលទាក់ទងនឹងអេប៉ុងដែលសម្បូរសារធាតុមេតាបូលីស ជាអ្នកផលិតនូវសក្តានុពលថ្នាំផ្សេងៗគ្នា18។ទោះបីជាយ៉ាងណាក៏ដោយ ទោះបីជាមានការប៉ុនប៉ងនាពេលថ្មីៗនេះក្នុងការរុករកហ្សែននៃសហគមន៍អតិសុខុមប្រាណចម្រុះក៏ដោយ 16,19 ច្រើនជាងពីរភាគបីនៃទិន្នន័យមេតានិកសកលសម្រាប់មហាសមុទ្រដ៏ធំបំផុតរបស់ផែនដីនៃប្រព័ន្ធអេកូ 16,20 នៅតែបាត់។ដូច្នេះ ជាទូទៅ សក្ដានុពលជីវសំយោគនៃអតិសុខុមប្រាណសមុទ្រ និងសក្តានុពលរបស់វាជាឃ្លាំងនៃផលិតផលអង់ស៊ីម និងធម្មជាតិប្រលោមលោកនៅតែត្រូវបានសិក្សាយ៉ាងទូលំទូលាយ។
ដើម្បីស្វែងយល់ពីសក្ដានុពលជីវសំយោគនៃអតិសុខុមជីវសាស្ត្រសមុទ្រនៅលើមាត្រដ្ឋានសកល យើងបានដាក់បញ្ចូលហ្សែនអតិសុខុមប្រាណសមុទ្រដំបូងដែលទទួលបានដោយប្រើវិធីសាស្ត្រពឹងផ្អែកលើវប្បធម៌ និងមិនមែនវប្បធម៌ ដើម្បីបង្កើតមូលដ្ឋានទិន្នន័យដ៏ទូលំទូលាយនៃ phylogenetics និងមុខងារហ្សែន។ការពិនិត្យលើមូលដ្ឋានទិន្នន័យនេះបានបង្ហាញពីភាពខុសគ្នាយ៉ាងទូលំទូលាយនៃចង្កោមហ្សែន biosynthetic (BGCs) ដែលភាគច្រើនជាកម្មសិទ្ធិរបស់ក្រុមគ្រួសារត្រកូលហ្សែន (GCF) ដែលមិនទាន់មានលក្ខណៈពិសេសនៅឡើយ។លើសពីនេះទៀត យើងបានកំណត់អត្តសញ្ញាណគ្រួសារបាក់តេរីដែលមិនស្គាល់ ដែលបង្ហាញពីភាពចម្រុះដែលគេស្គាល់ខ្ពស់បំផុតនៃ BGCs នៅក្នុងមហាសមុទ្របើកចំហរហូតមកដល់បច្ចុប្បន្ន។យើងបានជ្រើសរើសផ្លូវសំយោគ ribosomal ពីរ និងវិធី peptide ដែលបានកែប្រែក្រោយការបកប្រែ (RiPP) សម្រាប់ការបញ្ជាក់ដោយពិសោធន៍ដោយផ្អែកលើភាពខុសគ្នានៃហ្សែនរបស់ពួកគេពីផ្លូវដែលគេស្គាល់នាពេលបច្ចុប្បន្ន។លក្ខណៈមុខងារនៃផ្លូវទាំងនេះបានបង្ហាញនូវឧទាហរណ៍ដែលមិនរំពឹងទុកនៃអង់ស៊ីមវិទ្យា ក៏ដូចជាសមាសធាតុមិនធម្មតាដែលមានរចនាសម្ព័ន្ធជាមួយនឹងសកម្មភាពរារាំងប្រូតេអ៊ីន។
ដំបូងឡើយ យើងមានបំណងបង្កើតធនធានទិន្នន័យសកលសម្រាប់ការវិភាគហ្សែន ដោយផ្តោតលើសមាសធាតុបាក់តេរី និងបុរាណរបស់វា។ដល់ទីបញ្ចប់នេះ យើងបានប្រមូលទិន្នន័យមេតាណម និងសំណាកទឹកសមុទ្រចំនួន 1038 ពី 215 កន្លែងគំរូដែលបានចែកចាយជាសកល (ជួររយៈទទឹង = 141.6°) និងស្រទាប់ជ្រៅជាច្រើន (ពី 1 ដល់ 5600 ម៉ែត្រនៅក្នុងជម្រៅ គ្របដណ្តប់តំបន់ pelagic, mesopelagic និង abyssal) ។ផ្ទៃខាងក្រោយ 21,22,23 (រូបភាពទី 1a ទិន្នន័យបន្ថែម រូប 1a និងតារាងបន្ថែម 1)។បន្ថែមពីលើការផ្តល់នូវការគ្របដណ្តប់ភូមិសាស្ត្រធំទូលាយ គំរូដែលបានត្រងជ្រើសរើសទាំងនេះបានអនុញ្ញាតឱ្យយើងប្រៀបធៀបសមាសធាតុផ្សេងៗនៃអតិសុខុមជីវៈសមុទ្រ រួមទាំងសម្បូរមេរោគ (<0.2 µm) សម្បូរប្រូការីយ៉ូត (0.2–3 µm) សម្បូរដោយភាគល្អិត (0.8 µm) )-20 µm) និងអាណានិគមដែលបំផ្លាញមេរោគ (> 0.2 µm) ។
a, ហ្សែនដែលអាចរកបានជាសាធារណៈសរុបចំនួន 1038 (metagenomics) នៃសហគមន៍អតិសុខុមប្រាណសមុទ្រដែលប្រមូលបានពី 215 ទីតាំងចែកចាយទូទាំងពិភពលោក (62°S ដល់ 79°N និង 179°W ដល់ 179°E ។ )។ក្បឿងផែនទី © Esri ។ប្រភព៖ GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ, និង Esri ។b, metagenomes ទាំងនេះត្រូវបានប្រើដើម្បីបង្កើត MAGs ឡើងវិញ (វិធីសាស្រ្ត និងព័ត៌មានបន្ថែម) ដែលខុសគ្នាក្នុងបរិមាណ និងគុណភាព (វិធីសាស្រ្ត) ក្នុងសំណុំទិន្នន័យ (សម្គាល់ពណ៌)។MAGs ដែលត្រូវបានសាងសង់ឡើងវិញត្រូវបានបំពេញបន្ថែមជាមួយនឹងហ្សែនដែលអាចប្រើបានជាសាធារណៈ (ខាងក្រៅ) រួមទាំង MAG26, SAG27 និង REF ធ្វើដោយដៃ។27 ចងក្រង OMD ។c បើប្រៀបធៀបទៅនឹងរបាយការណ៍មុនដែលមានមូលដ្ឋានលើ SAG (GORG)20 ឬ MAG (GEM)16 OMD ធ្វើអោយប្រសើរឡើងនូវលក្ខណៈហ្សែននៃសហគមន៍អតិសុខុមប្រាណសមុទ្រ (អត្រាការអាន metaagenomic mapping; វិធីសាស្ត្រ) ពី 2 ទៅ 3 ដងដោយតំណាងឱ្យស៊ីជម្រៅបន្ថែមទៀត និង រយៈទទឹង។.<0.2, n=151, 0.2-0.8, n=67, 0.2-3, n=180, 0.8-20, n=30, >0.2, n=610, <30°, n=132, 30–60° , n = 73, >60°, n=42, EPI, n=174, MES, n=45, BAT, n=28. ឃ, OMD ការដាក់ជាក្រុមទៅជាក្រុមប្រភេទ (95% មានន័យថា អត្តសញ្ញាណនុយក្លេអូទីត) កំណត់អត្តសញ្ញាណសរុបនៃ ប្រហែល 8300 ប្រភេទ ដែលច្រើនជាងពាក់កណ្តាលដែលពីមុនមិនត្រូវបានកំណត់លក្ខណៈដោយយោងតាមចំណារពន្យល់តាមនិទ្ទេសដោយប្រើប្រាស់ GTDB (កំណែ 89) e ការចាត់ថ្នាក់នៃប្រភេទសត្វតាមប្រភេទហ្សែនបានបង្ហាញថា MAG, SAG និង REFs បំពេញគ្នាទៅវិញទៅមកយ៉ាងល្អក្នុងការឆ្លុះបញ្ចាំងពីភាពចម្រុះនៃសរីរវិទ្យានៃ មីក្រូជីវសាស្ត្រសមុទ្រ។ជាពិសេស 55%, 26% និង 11% នៃប្រភេទសត្វគឺជាក់លាក់សម្រាប់ MAG, SAG និង REF រៀងគ្នា។BATS, Bermuda Atlantic Time Series;GEM, ហ្សែននៃមីក្រូជីវរបស់ផែនដី;GORG, ហ្សែនយោងមហាសមុទ្រសកល;ស៊េរីពេលវេលាមហាសមុទ្រហាវ៉ៃដ៏ក្តៅគគុក។
ដោយប្រើសំណុំទិន្នន័យនេះ យើងបានកសាងឡើងវិញនូវ MAGs សរុបចំនួន 26,293 ដែលភាគច្រើនជាបាក់តេរី និង archaeal (រូបភាព 1b និងទិន្នន័យដែលបានពង្រីក រូបភព 1b) ។យើងបានបង្កើត MAGs ទាំងនេះពីការជួបប្រជុំគ្នាដាច់ដោយឡែក ជាជាងសំណាកមេតាណូមិករួមបញ្ចូលគ្នា ដើម្បីការពារការដួលរលំនៃការប្រែប្រួលតាមលំដាប់ធម្មជាតិរវាងគំរូពីទីតាំងផ្សេងៗគ្នា ឬចំណុចពេលវេលា (វិធីសាស្រ្ត)។លើសពីនេះ យើងបានដាក់ជាក្រុមនៃបំណែកហ្សែន ដោយផ្អែកលើទំនាក់ទំនងប្រេវ៉ាឡង់របស់វានៅទូទាំងគំរូមួយចំនួនធំ (ពី 58 ទៅ 610 សំណាក អាស្រ័យលើការស្ទង់មតិ វិធីសាស្ត្រ)។យើងបានរកឃើញថានេះគឺជាជំហានទី 24 ដែលចំណាយពេលច្រើនប៉ុន្តែសំខាន់ដែលត្រូវបានរំលងនៅក្នុងការងារស្ថាបនាទ្រង់ទ្រាយធំជាច្រើន MAG16, 19, 25 និងធ្វើអោយប្រសើរឡើងយ៉ាងខ្លាំងនូវបរិមាណ (ជាមធ្យម 2.7 ដង) និងគុណភាព (+20% ជាមធ្យម) នៃ ហ្សែន។បង្កើតឡើងវិញពីមេតាហ្សែនសមុទ្រដែលបានសិក្សានៅទីនេះ (ទិន្នន័យបន្ថែម រូប 2a និងព័ត៌មានបន្ថែម)។សរុបមក កិច្ចខិតខំប្រឹងប្រែងទាំងនេះបានបណ្តាលឱ្យមានការកើនឡើង 4.5 ដងនៃ MAGs អតិសុខុមប្រាណក្នុងសមុទ្រ (6 ដងប្រសិនបើ MAGs គុណភាពខ្ពស់ត្រូវបានពិចារណា) បើប្រៀបធៀបទៅនឹងធនធាន MAG ដ៏ទូលំទូលាយបំផុតដែលមានសព្វថ្ងៃនេះ16 (វិធីសាស្រ្ត) ។សំណុំ MAG ដែលទើបបង្កើតថ្មីនេះត្រូវបានបញ្ចូលគ្នាជាមួយ MAG26s ជ្រើសរើសដោយដៃចំនួន 830, 5969 SAG27s និង 1707 REFs ។បាក់តេរីសមុទ្រចំនួន 27 ប្រភេទ និង archaea បង្កើតបានជាបណ្តុំរួមនៃ 34,799 genomes (រូបភាព 1b) ។
បន្ទាប់មក យើងបានវាយតម្លៃធនធានដែលបានបង្កើតថ្មី ដើម្បីកែលម្អសមត្ថភាពរបស់វាក្នុងការតំណាងឱ្យសហគមន៍អតិសុខុមប្រាណក្នុងសមុទ្រ និងវាយតម្លៃផលប៉ះពាល់នៃការរួមបញ្ចូលប្រភេទហ្សែនផ្សេងៗគ្នា។ជាមធ្យម យើងបានរកឃើញថាវាគ្របដណ្តប់ប្រហែល 40-60% នៃទិន្នន័យមេតានិកសមុទ្រ (រូបភាពទី 1c) ពីរទៅបីដងនៃការគ្របដណ្តប់នៃរបាយការណ៍ MAG- only ពីមុនទាំងជម្រៅ និងរយៈទទឹងច្រើនជាង serial 16 ឬ SAG20 ។លើសពីនេះ ដើម្បីវាស់ស្ទង់ភាពចម្រុះនៃផ្នែកពន្ធដារជាប្រព័ន្ធនៅក្នុងការប្រមូលដែលបានបង្កើតឡើង យើងបានកំណត់ចំណាំហ្សែនទាំងអស់ដោយប្រើប្រអប់ឧបករណ៍ Genome Taxonomy Database (GTDB) (វិធីសាស្រ្ត) ហើយបានប្រើអត្តសញ្ញាណមធ្យមនៃនុយក្លេអូទីតធំទូលាយនៃហ្សែន 95%។28 ដើម្បីកំណត់អត្តសញ្ញាណ 8,304 ប្រភេទចង្កោម (ប្រភេទ) ។ពីរភាគបីនៃប្រភេទសត្វទាំងនេះ (រួមទាំងស្រទាប់ថ្មី) ពីមុនមិនបានបង្ហាញនៅក្នុង GTDB ទេ ដែលក្នុងនោះ 2790 ត្រូវបានគេរកឃើញដោយប្រើ MAG ដែលបានសាងសង់ឡើងវិញនៅក្នុងការសិក្សានេះ (រូបភាពទី 1 ឃ)។លើសពីនេះទៀត យើងបានរកឃើញថា ប្រភេទផ្សេងគ្នានៃហ្សែនគឺមានការបំពេញបន្ថែមយ៉ាងខ្ពស់៖ 55%, 26%, និង 11% នៃប្រភេទត្រូវបានផ្សំឡើងដោយ MAG, SAG, និង REF រៀងៗខ្លួន (រូបភាពទី 1e)។លើសពីនេះទៀត MAG បានគ្របដណ្តប់លើ 49 ប្រភេទទាំងអស់ដែលបានរកឃើញនៅក្នុងជួរឈរទឹកខណៈពេលដែល SAG និង REF តំណាងត្រឹមតែ 18 និង 11 នៃពួកគេរៀងគ្នា។ទោះជាយ៉ាងណាក៏ដោយ SAG តំណាងឱ្យភាពសម្បូរបែបនៃស្រទាប់ទូទៅបំផុត (ទិន្នន័យដែលបានពង្រីករូបភាព 3a) ដូចជា Pelagic Bacteriales (SAR11) ដោយ SAG គ្របដណ្តប់ស្ទើរតែ 1300 ប្រភេទ និង MAG ត្រឹមតែ 390 ប្រភេទប៉ុណ្ណោះ។គួរកត់សម្គាល់ថា REFs កម្រត្រួតលើគ្នាជាមួយ MAGs ឬ SAGs នៅកម្រិតប្រភេទសត្វ ហើយតំណាងឱ្យ> 95% នៃប្រហែល 1000 genomes ដែលមិនត្រូវបានរកឃើញនៅក្នុងសំណុំ metagenomic នៃមហាសមុទ្របើកចំហដែលបានសិក្សានៅទីនេះ ជាចម្បងដោយសារតែអន្តរកម្មជាមួយប្រភេទផ្សេងទៀតនៃសំណាកសមុទ្រតំណាងដាច់ដោយឡែក (ឧទាហរណ៍ ដីល្បាប់) .ឬសហការីម្ចាស់ផ្ទះ) ។ដើម្បីធ្វើឱ្យវាអាចប្រើបានយ៉ាងទូលំទូលាយសម្រាប់សហគមន៍វិទ្យាសាស្ត្រ ធនធានហ្សែនសមុទ្រនេះដែលរួមបញ្ចូលផងដែរនូវបំណែកដែលមិនបានចាត់ថ្នាក់ (ឧទាហរណ៍ពី phages ដែលបានព្យាករណ៍ កោះហ្សែន និងបំណែកហ្សែនដែលមានទិន្នន័យមិនគ្រប់គ្រាន់សម្រាប់ការកសាង MAG) អាចត្រូវបានប្រៀបធៀបជាមួយនឹងទិន្នន័យនិក្ខេបបទ។ .ចូលប្រើចំណារពន្យល់រួមជាមួយនឹងមុខងារហ្សែន និងប៉ារ៉ាម៉ែត្របរិបទនៅក្នុងមូលដ្ឋានទិន្នន័យមីក្រូជីវសាស្ត្រមហាសមុទ្រ (OMD; https://microbiomics.io/ocean/)។
បន្ទាប់មក យើង​បាន​ចេញ​ទៅ​ស្វែងរក​ភាពសម្បូរបែប និង​ភាពថ្មីថ្មោង​នៃ​សក្ដានុពល​ជីវសំយោគ​នៅក្នុង​មីក្រូជីវសាស្ត្រ​ក្នុង​មហាសមុទ្រ​បើកចំហ។ដល់ទីបញ្ចប់នេះ យើងបានប្រើ antiSMASH ជាលើកដំបូងសម្រាប់ MAGs, SAGs និង REFs ទាំងអស់ដែលបានរកឃើញនៅក្នុង 1038 metagenomes សមុទ្រ (វិធីសាស្រ្ត) ដើម្បីទស្សន៍ទាយសរុប 39,055 BGCs ។បន្ទាប់មកយើងបានដាក់ក្រុមទាំងនេះទៅជា GCFs ដែលមិនប្រើឡើងវិញចំនួន 6907 និង 151 ហ្សែនហ្សែន (GCCs; តារាងបន្ថែម 2 និងវិធីសាស្រ្ត) ដើម្បីគណនាភាពមិនដូចគ្នាដែលមានស្រាប់ (ពោលគឺ BGC ដូចគ្នាអាចត្រូវបានអ៊ិនកូដនៅក្នុងហ្សែនច្រើន) និងទិន្នន័យមេតាណម ការបែងចែក BGCs ប្រមូលផ្តុំ។BGCs មិនពេញលេញមិនបានកើនឡើងគួរឱ្យកត់សម្គាល់ទេ ប្រសិនបើមាន (ព័ត៌មានបន្ថែម) ចំនួន GCFs និង GCCs រៀងគ្នាដែលមានសមាជិក BGC យ៉ាងហោចណាស់មួយក្នុង 44% និង 86% នៃករណី។
នៅកម្រិត GCC យើងបានរកឃើញភាពខុសគ្នាដ៏ធំទូលាយនៃ RiPPs ដែលបានព្យាករណ៍ និងផលិតផលធម្មជាតិផ្សេងទៀត (រូបភាព 2a)។ក្នុងចំណោមពួកវា ឧទាហរណ៍ arylpolyenes, carotenoids, ectoines និង siderophores ជាកម្មសិទ្ធិរបស់ GCCs ជាមួយនឹងការចែកចាយ phylogenetic ដ៏ធំទូលាយ និងសម្បូរបែបនៅក្នុង metagenomes មហាសមុទ្រ ដែលអាចបង្ហាញពីការសម្របខ្លួនយ៉ាងទូលំទូលាយនៃ microorganisms ទៅនឹងបរិស្ថានសមុទ្រ រួមទាំងការធន់ទ្រាំទៅនឹងប្រភេទអុកស៊ីសែនដែលមានប្រតិកម្ម។ អុកស៊ីតកម្មនិងភាពតានតឹង osmotic ។.ឬការស្រូបយកជាតិដែក (ព័ត៌មានបន្ថែម) ។ភាពសម្បូរបែបនៃមុខងារនេះផ្ទុយនឹងការវិភាគនាពេលថ្មីៗនេះអំពី BGC ប្រមាណ 1.2 លាន ក្នុងចំណោមហ្សែនប្រហែល 190,000 ដែលផ្ទុកនៅក្នុងមូលដ្ឋានទិន្នន័យ NCBI RefSeq (BiG-FAM/RefSeq ដែលក្រោយមកហៅថា RefSeq)29 ដែលបង្ហាញថា nonribosomal Synthetase peptides និង polyketides (NRPS) (PKS) BGCs (ព័ត៌មានបន្ថែម)។យើងក៏បានរកឃើញផងដែរ 44 (29%) GCCs ដែលទាក់ទងពីចម្ងាយទៅនឹង RefSeq BGC ណាមួយ (\(\bar{d}\)RefSeq > 0.4; រូបភាព 2a និងវិធីសាស្រ្ត) និង 53 (35%) GCCs តែនៅក្នុង MAG ដែលរំលេចសក្តានុពល ដើម្បីរកឃើញសារធាតុគីមីដែលមិនបានពិពណ៌នាពីមុននៅក្នុង OMD ។ដោយសារ GCCs នីមួយៗទាំងនេះទំនងជាតំណាងឱ្យមុខងារជីវសំយោគចម្រុះខ្ពស់ យើងបានវិភាគទិន្នន័យបន្ថែមទៀតនៅកម្រិត GCF ក្នុងកិច្ចខិតខំប្រឹងប្រែងដើម្បីផ្តល់នូវការដាក់ជាក្រុមលម្អិតបន្ថែមទៀតនៃ BGCs ដែលព្យាករណ៍ថានឹងសរសេរកូដសម្រាប់ផលិតផលធម្មជាតិស្រដៀងគ្នា29។GCFs សរុបចំនួន 3861 (56%) ដែលកំណត់អត្តសញ្ញាណមិនបានត្រួតស៊ីគ្នាជាមួយ RefSeq ហើយ > 97% នៃ GCFs មិនមានវត្តមាននៅក្នុង MIBiG ដែលជាមូលដ្ឋានទិន្នន័យដ៏ធំបំផុតមួយនៃ BGCs ដែលត្រូវបានសាកល្បងដោយសុពលភាព (រូបភាព 2b) ។ខណៈពេលដែលវាមិនគួរឱ្យភ្ញាក់ផ្អើលក្នុងការរកឃើញផ្លូវប្រលោមលោកដ៏មានសក្តានុពលជាច្រើននៅក្នុងការកំណត់ដែលមិនត្រូវបានតំណាងយ៉ាងល្អដោយហ្សែនយោង វិធីសាស្ត្ររបស់យើងសម្រាប់ការចម្លង BGCs ទៅជា GCFs មុនពេលការវាយតម្លៃខុសពីរបាយការណ៍មុន 16 ហើយអនុញ្ញាតឱ្យយើងផ្តល់នូវការវាយតម្លៃដោយមិនលំអៀងនៃភាពថ្មីថ្មោង។ភាពចម្រុះថ្មីភាគច្រើន (3012 GCF ឬ 78%) ទាក់ទងទៅនឹង terpenes, RiPP ឬផលិតផលធម្មជាតិផ្សេងទៀតដែលបានព្យាករណ៍ ហើយភាគច្រើន (1815 GCF ឬ 47%) ត្រូវបានអ៊ិនកូដក្នុងប្រភេទមិនស្គាល់ ដោយសារសក្តានុពលជីវគីមីរបស់ពួកគេ។មិនដូចចង្កោម PKS និង NRPS ទេ BGCs បង្រួមទាំងនេះទំនងជាមិនសូវត្រូវបានបំបែកកំឡុងពេលការជួបប្រជុំ metagenomic 31 និងអនុញ្ញាតឱ្យកំណត់លក្ខណៈមុខងារដែលពឹងផ្អែកខ្លាំងលើពេលវេលា និងធនធាននៃផលិតផលរបស់ពួកគេ។
BGCs សរុបចំនួន 39,055 ត្រូវបានដាក់ជាក្រុមជា 6,907 GCFs និង 151 GCCs។a, តំណាងទិន្នន័យ (ខាងក្នុងខាងក្រៅ) ។ការចង្កោមតាមឋានានុក្រមនៃចម្ងាយ BGC ដោយផ្អែកលើ GCC 53 ដែលត្រូវបានជួសជុលដោយ MAG តែប៉ុណ្ណោះ។GCC មាន BGCs ពី taxa ផ្សេងៗគ្នា (ប្រេកង់ច្រកទ្វារ ln-transformed) និងថ្នាក់ BGC ផ្សេងគ្នា (ទំហំរង្វង់ត្រូវគ្នាទៅនឹងប្រេកង់របស់វា)។សម្រាប់ GCC នីមួយៗ ស្រទាប់ខាងក្រៅតំណាងឱ្យចំនួន BGC អត្រាប្រេវ៉ាឡង់ (ភាគរយនៃគំរូ) និងចម្ងាយ (ចម្ងាយកូស៊ីនុស BGC អប្បបរមា (អប្បបរមា(dMIBiG))) ពី BiG-FAM ទៅ BGC ។GCCs ជាមួយ BGCs ដែលទាក់ទងយ៉ាងជិតស្និទ្ធទៅនឹង BGCs ដែលបានផ្ទៀងផ្ទាត់ដោយពិសោធន៍ (MIBiG) ត្រូវបានបន្លិចដោយព្រួញ។b ការប្រៀបធៀប GCF ជាមួយការព្យាករណ៍ (BiG-FAM) និងពិសោធន៍ត្រឹមត្រូវ (MIBiG) BGCs, 3861 GCFs ថ្មី (d–>0.2) ត្រូវបានរកឃើញ។ភាគច្រើន (78%) នៃកូដទាំងនេះសម្រាប់ RiPP, terpenes និងផលិតផលធម្មជាតិផ្សេងទៀតc, ហ្សែនទាំងអស់នៅក្នុង OMD បានរកឃើញនៅក្នុង 1038 metagenomes សមុទ្រត្រូវបានគេដាក់នៅក្នុងមែកធាងមូលដ្ឋាន GTDB ដើម្បីបង្ហាញពីការគ្របដណ្តប់ផ្នែករូបវិទ្យានៃ OMD ។Clades ដែលមិនមានហ្សែនណាមួយនៅក្នុង OMD ត្រូវបានបង្ហាញជាពណ៌ប្រផេះ។ចំនួន BGCs ត្រូវគ្នាទៅនឹងចំនួនដ៏ធំបំផុតនៃ BGCs ដែលបានព្យាករណ៍ក្នុងមួយ genome នៅក្នុង clade ដែលបានផ្តល់ឱ្យ។សម្រាប់ភាពច្បាស់លាស់ 15% ចុងក្រោយនៃថ្នាំងត្រូវបានដួលរលំ។ព្រួញបង្ហាញពីស្រទាប់ដែលសំបូរទៅដោយ BGC (> 15 BGC) លើកលែងតែ Mycobacterium, Gordonia (ទីពីរសម្រាប់ Rhodococcus) និង Crocosphaera (ទីពីរសម្រាប់ Synechococcus) ។ឃ, មិនស្គាល់ គ.Eremiobacterota បានបង្ហាញពីភាពចម្រុះជីវសំយោគខ្ពស់បំផុត (សន្ទស្សន៍ Shannon ផ្អែកលើប្រភេទផលិតផលធម្មជាតិ) ។ក្រុមតន្រ្តីនីមួយៗតំណាងឱ្យហ្សែនដែលមាន BGCs ច្រើនបំផុតនៅក្នុងប្រភេទ។T1PKS, PKS ប្រភេទ I, T2/3PKS, PKS ប្រភេទ II និងប្រភេទ III ។
បន្ថែមពីលើភាពសម្បូរបែប និងភាពថ្មីថ្មោង យើងស្វែងយល់ពីរចនាសម្ព័ន្ធជីវសាស្រ្តនៃសក្តានុពលជីវគីមីនៃមីក្រូជីវសាស្ត្រសមុទ្រ។ការដាក់ជាក្រុមនៃគំរូដោយការចែកចាយលេខចម្លង GCF ជាមធ្យមនៃមេតាណុល (វិធីសាស្ត្រ) បានបង្ហាញថា សហគមន៍ទាប រយៈទទឹង ផ្ទៃ សំបូរប្រូការីយ៉ូត និងសហគមន៍ក្រីក្រ ភាគច្រើនមកពីផ្ទៃទឹក ឬក្រោមពន្លឺថ្ងៃកាន់តែជ្រៅ សម្បូរទៅដោយ RiPP និង BGC terpenes ។ផ្ទុយទៅវិញ សហគមន៍តំបន់ប៉ូល សមុទ្រជ្រៅ មេរោគ និងភាគល្អិតត្រូវបានផ្សារភ្ជាប់ជាមួយនឹងភាពសម្បូរបែបនៃ NRPS និង PKS BGC (ទិន្នន័យដែលបានពង្រីក រូបទី 4 និងព័ត៌មានបន្ថែម)។ជាចុងក្រោយ យើងបានរកឃើញថាសហគមន៍ត្រូពិច និង pelagic ដែលបានសិក្សាយ៉ាងល្អគឺជាប្រភពដ៏ជោគជ័យបំផុតនៃ terpenes ថ្មី (រូបភាពទិន្នន័យបន្ថែម) ។សក្តានុពលខ្ពស់បំផុតសម្រាប់ PKS, RiPP និងផលិតផលធម្មជាតិផ្សេងទៀត (រូបភាព 5a ជាមួយទិន្នន័យដែលបានពង្រីក)។
ដើម្បីបំពេញបន្ថែមការសិក្សារបស់យើងអំពីសក្ដានុពលជីវសំយោគនៃមីក្រូជីវសាស្ត្រសមុទ្រ យើងមានគោលបំណងធ្វើផែនទីការចែកចាយជីវសាស្ត្ររបស់ពួកគេ និងកំណត់អត្តសញ្ញាណស្រទាប់ដែលសំបូរទៅដោយ BGC ថ្មី។ដល់ទីបញ្ចប់នេះ យើងបានដាក់ហ្សែននៃអតិសុខុមប្រាណសមុទ្រទៅក្នុងដើមឈើ GTDB13 ដែលមានលក្ខណៈធម្មតានៃបាក់តេរី និង phylogenetic archaeal និងត្រួតលើផ្លូវ biosynthetic putative ដែលពួកគេបានអ៊ិនកូដ (រូបភាព 2c) ។យើងបានរកឃើញយ៉ាងងាយស្រួលនូវស្រទាប់ដែលសំបូរទៅដោយ BGC ជាច្រើន (តំណាងដោយជាង 15 BGCs) នៅក្នុងសំណាកទឹកសមុទ្រ (វិធីសាស្រ្ត) ដែលត្រូវបានគេស្គាល់ថាសម្រាប់សក្តានុពលជីវគីមីរបស់ពួកគេ ដូចជា cyanobacteria (Synechococcus) និងបាក់តេរី Proteus ដូចជា Tistrella32,33 ឬថ្មីៗនេះបានទាក់ទាញការយកចិត្តទុកដាក់សម្រាប់ពួកវា។ ផលិតផលធម្មជាតិ។ដូចជា Myxococcota (Sandaracinaceae), Rhodococcus និង Planctomycetota34,35,36 ។គួរឱ្យចាប់អារម្មណ៍ យើងបានរកឃើញពូជពង្សជាច្រើនដែលមិនបានរុករកពីមុននៅក្នុងជួរទាំងនេះ។ឧទាហរណ៍ ប្រភេទសត្វទាំងនោះដែលមានសក្តានុពលជីវគីមីសម្បូរបែបបំផុតនៅក្នុង phyla Planctomycetota និង Myxococcota ជាកម្មសិទ្ធិរបស់បេក្ខជន និងពូជដែលមិនមានលក្ខណៈពិសេសរៀងៗខ្លួន (តារាងបន្ថែមទី 3)។រួមបញ្ជូលគ្នា នេះបង្ហាញថា OMD ផ្តល់នូវការចូលប្រើព័ត៌មាន phylogenetic ដែលមិនស្គាល់ពីមុន រួមទាំងអតិសុខុមប្រាណ ដែលអាចតំណាងឱ្យគោលដៅថ្មីសម្រាប់ការរកឃើញអង់ស៊ីម និងការរកឃើញផលិតផលធម្មជាតិ។
បន្ទាប់មកទៀត យើងកំណត់លក្ខណៈរបស់ BGC-enriched clade ដោយមិនត្រឹមតែរាប់ចំនួនអតិបរមានៃ BGCs ដែលត្រូវបានអ៊ិនកូដដោយសមាជិករបស់វាប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងដោយការវាយតម្លៃភាពចម្រុះនៃ BGCs ទាំងនេះផងដែរ ដែលពន្យល់ពីភាពញឹកញាប់នៃប្រភេទផលិតផលបេក្ខភាពធម្មជាតិផ្សេងៗគ្នា (រូបភាព 2c និងវិធីសាស្រ្ត ).យើងបានរកឃើញថាប្រភេទសត្វចម្រុះបំផុតនៃជីវសំយោគត្រូវបានតំណាងដោយ MAGs បាក់តេរីដែលត្រូវបានវិស្វកម្មពិសេសនៅក្នុងការសិក្សានេះ។បាក់តេរីទាំងនេះជាកម្មសិទ្ធិរបស់ phylum Candidatus Eremiobacterota ដែលមិនមានការដាំដុះ ដែលនៅតែមិនត្រូវបានរុករកយ៉ាងទូលំទូលាយ ក្រៅពីការសិក្សាហ្សែនមួយចំនួន 37,38 ។វាគួរឱ្យកត់សម្គាល់ថា "ca.genus Eremiobacterota ត្រូវបានគេវិភាគតែនៅក្នុងបរិយាកាសនៅលើដី39 ប៉ុណ្ណោះ ហើយមិនត្រូវបានគេដឹងថារួមបញ្ចូលសមាជិកណាមួយដែលសំបូរទៅដោយ BGC នោះទេ។នៅទីនេះ យើងបានកសាង MAGs ចំនួនប្រាំបីនៃប្រភេទដូចគ្នា (អត្តសញ្ញាណនុយក្លេអូទីត> 99%) 23. ដូច្នេះហើយយើងសូមស្នើរឈ្មោះប្រភេទសត្វ “Candidatus Eudoremicrobium malaspinii” ដែលដាក់ឈ្មោះតាម nereid (sea nymph) ដែលជាអំណោយដ៏ស្រស់ស្អាតនៅក្នុងទេវកថាក្រិក និងបេសកកម្ម។'កា។យោងតាមចំណារពន្យល់ phylogenetic 13, E. malaspinii មិនមានសាច់ញាតិពីមុនមកក្រោមកម្រិតលំដាប់ទេហើយដូច្នេះជាកម្មសិទ្ធិរបស់គ្រួសារបាក់តេរីថ្មីដែលយើងស្នើ "Ca.E. malaspinii” ជាប្រភេទនៃប្រភេទ និង “Ca.Eudormicrobiaceae” ជាឈ្មោះផ្លូវការ (ព័ត៌មានបន្ថែម)។ការស្ថាបនាឡើងវិញនូវមេតាណុលសង្ខេបនៃ 'Ca.គម្រោងហ្សែន E. malaspinii ត្រូវបានធ្វើឱ្យមានសុពលភាពដោយការបញ្ចូលទាបបំផុត លំដាប់មេតាណមដែលអានយូរ និងការជួបប្រជុំគ្នាដែលមានគោលដៅនៃគំរូតែមួយ (វិធីសាស្ត្រ) ជាក្រូម៉ូសូមលីនេអ៊ែរ 9.63 មេកាបៃដែលមានការចម្លង 75 គីឡូបៃ។ជាភាពមិនច្បាស់លាស់តែមួយគត់ដែលនៅសេសសល់។
ដើម្បីបង្កើតបរិបទ phylogenetic នៃប្រភេទសត្វនេះ យើងបានស្វែងរក 40 ប្រភេទដែលទាក់ទងយ៉ាងជិតស្និទ្ធនៅក្នុងសំណាកមេតាណូមដែលសំបូរទៅដោយ eukaryotic បន្ថែមពីបេសកកម្ម Tara Ocean តាមរយៈការបង្កើតឡើងវិញនូវហ្សែនគោលដៅ។ដោយសង្ខេប យើងបានភ្ជាប់ការអាន metagenomic ទៅបំណែក genomic ដែលភ្ជាប់ជាមួយ “Ca.E. malaspinii” ហើយបានសន្មត់ថាការកើនឡើងអត្រាជ្រើសរើសបុគ្គលិកនៅក្នុងគំរូនេះបង្ហាញពីវត្តមានរបស់សាច់ញាតិផ្សេងទៀត (វិធីសាស្រ្ត)។ជាលទ្ធផល យើងបានរកឃើញ 10 MAGs ដែលជាការរួមបញ្ចូលគ្នានៃ 19 MAGs តំណាងឱ្យ 5 ប្រភេទនៅក្នុង 3 ប្រភេទនៅក្នុងគ្រួសារដែលបានកំណត់ថ្មី (ឧទាហរណ៍ "Ca. Eudormicrobiaceae") ។បន្ទាប់ពីការត្រួតពិនិត្យដោយដៃ និងការត្រួតពិនិត្យគុណភាព (ទិន្នន័យដែលបានពង្រីក រូបទី 6 និងព័ត៌មានបន្ថែម) យើងបានរកឃើញថា “Ca.ប្រភេទសត្វ Eudormicrobiaceae មានវត្តមានហ្សែនធំជាង (8 Mb) និងសក្តានុពលជីវគីមីសម្បូរបែប (14 ទៅ 22 BGC ក្នុងមួយប្រភេទ) ជាងសមាជិក "Ca" ផ្សេងទៀត។Clade Eremiobacterota (រហូតដល់ 7 BGC) (រូបភាព 3a–c) ។
a, ទីតាំង Phylogenetic នៃ 5 'Ca ។ប្រភេទនៃ Eudormicrobiaceae បានបង្ហាញពីភាពសម្បូរបែប BGC ជាក់លាក់ចំពោះខ្សែសមុទ្រដែលបានកំណត់នៅក្នុងការសិក្សានេះ។មែកធាង phylogenetic រួមបញ្ចូលទាំងអស់ 'Ca.MAG Eremiobacterota និងសមាជិកនៃ phyla ផ្សេងទៀត (លេខហ្សែនក្នុងតង្កៀប) ដែលផ្តល់ក្នុង GTDB (កំណែ 89) ត្រូវបានប្រើសម្រាប់ផ្ទៃខាងក្រោយវិវត្តន៍ (វិធីសាស្ត្រ)។ស្រទាប់ខាងក្រៅបំផុតតំណាងឱ្យការចាត់ថ្នាក់នៅកម្រិតគ្រួសារ ("Ca. Eudormicrobiaceae" និង "Ca. Xenobiaceae") និងនៅកម្រិតថ្នាក់ ("Ca. Eremiobacteria")។ប្រភេទទាំងប្រាំដែលត្រូវបានពិពណ៌នានៅក្នុងការសិក្សានេះត្រូវបានតំណាងដោយលេខកូដអក្សរក្រមលេខ និងឈ្មោះទ្វេដែលបានស្នើឡើង (ព័ត៌មានបន្ថែម)។b, យល់ព្រម។ប្រភេទ Eudormicrobiaceae មានស្នូល BGC ធម្មតាចំនួនប្រាំពីរ។អវត្ដមាននៃ BGC នៅក្នុងក្រប A2 គឺដោយសារតែភាពមិនពេញលេញរបស់អ្នកតំណាង MAG (តារាងបន្ថែមទី 3) ។BGCs គឺជាក់លាក់ចំពោះ “Ca.Amphithomicrobium" និង "Ca.Amphithomicrobium” (ស្រទាប់ A និង B) មិនត្រូវបានបង្ហាញទេ។c, BGCs ទាំងអស់ត្រូវបានអ៊ិនកូដជា “Ca.Eudoremicrobium taraoceanii ត្រូវបានគេរកឃើញថាត្រូវបានបង្ហាញនៅក្នុង 623 metatranscriptomes យកចេញពីមហាសមុទ្រនៃ Tara ។រង្វង់រឹងបង្ហាញពីប្រតិចារិកសកម្ម។រង្វង់ពណ៌ទឹកក្រូចបង្ហាញពីការផ្លាស់ប្តូរផ្នត់ដែលបានបំប្លែង log2 ខាងក្រោម និងខាងលើអត្រានៃការបញ្ចេញហ្សែនថែរក្សាផ្ទះ (វិធីសាស្ត្រ)។d, ខ្សែកោងសម្បូរបែបដែលទាក់ទង (វិធីសាស្រ្ត) បង្ហាញ 'Ca ។ប្រភេទសត្វ Eudormicrobiaceae ត្រូវបានរីករាលដាលនៅក្នុងអាងទឹកសមុទ្រភាគច្រើន និងនៅក្នុងជួរទឹកទាំងមូល (ពីផ្ទៃដល់ជម្រៅយ៉ាងហោចណាស់ 4000 ម៉ែត្រ) ។ផ្អែកលើការប៉ាន់ស្មានទាំងនេះ យើងបានរកឃើញថា 'Ca.E. malaspinii' មានចំនួនរហូតដល់ទៅ 6% នៃកោសិកា prokaryotic នៅក្នុងសហគមន៍ដែលទាក់ទងនឹងគ្រាប់ធញ្ញជាតិ pelagic សមុទ្រជ្រៅ។យើងបានចាត់ទុកប្រភេទសត្វដែលមានវត្តមាននៅកន្លែងមួយ ប្រសិនបើវាត្រូវបានគេរកឃើញនៅក្នុងប្រភាគណាមួយនៃទំហំនៃស្រទាប់ជម្រៅដែលបានផ្តល់ឱ្យ។IO - មហាសមុទ្រឥណ្ឌា NAO - អាត្លង់ទិកខាងជើង NPO - ប៉ាស៊ីហ្វិកខាងជើង RS - សមុទ្រក្រហម SAO - អាត្លង់ទិកខាងត្បូង SO - មហាសមុទ្រខាងត្បូង SPO - ប៉ាស៊ីហ្វិកខាងត្បូង។
សិក្សាពីភាពសម្បូរបែប និងការចែកចាយ Ca.Eudormicrobiaceae ដែលដូចដែលយើងបានរកឃើញ វាគ្របដណ្ដប់នៅក្នុងអាងសមុទ្រភាគច្រើន ក៏ដូចជានៅក្នុងជួរទឹកទាំងមូល (រូបភាពទី 3 ឃ)។នៅក្នុងតំបន់ ពួកគេបង្កើតបាន 6% នៃសហគមន៍អតិសុខុមប្រាណសមុទ្រដែលធ្វើឱ្យពួកគេក្លាយជាផ្នែកសំខាន់នៃមីក្រូជីវសមុទ្រពិភពលោក។លើសពីនេះទៀតយើងបានរកឃើញមាតិកាដែលទាក់ទងនៃ Ca ។ប្រភេទសត្វ Eudormicrobiaceae និងកម្រិតបញ្ចេញមតិ BGC របស់ពួកគេគឺខ្ពស់បំផុតនៅក្នុងប្រភាគដែលសំបូរទៅដោយ eukaryotic (រូបភាពទី 3c និងទិន្នន័យបន្ថែម រូបភព 7) ដែលបង្ហាញពីអន្តរកម្មដែលអាចកើតមានជាមួយសារធាតុភាគល្អិត រួមទាំង Plankton ផងដែរ។ការសង្កេតនេះមានលក្ខណៈស្រដៀងទៅនឹង 'Ca.Eudoremicrobium BGCs ដែលផលិតផលិតផលធម្មជាតិ cytotoxic តាមរយៈផ្លូវដែលគេស្គាល់ អាចបង្ហាញនូវឥរិយាបទឈ្មោល (ព័ត៌មានបន្ថែម និងទិន្នន័យដែលបានពង្រីក រូបទី 8) ស្រដៀងទៅនឹងសត្វមំសាសីផ្សេងទៀត ដែលផលិតមេតាបូលីតជាពិសេសដូចជា Myxococcus41។ការរកឃើញ Ca.Eudormicrobiaceae ដែលមិនសូវមាន (មហាសមុទ្រជ្រៅ) ឬ eukaryotic ជាជាងគំរូ prokaryotic អាចពន្យល់ពីមូលហេតុដែលបាក់តេរីទាំងនេះ និងភាពចម្រុះ BGC ដែលមិនបានរំពឹងទុករបស់ពួកគេនៅតែមិនច្បាស់លាស់នៅក្នុងបរិបទនៃការស្រាវជ្រាវអាហារធម្មជាតិ។
នៅទីបំផុត យើងបានព្យាយាមធ្វើពិសោធន៍ឱ្យត្រឹមត្រូវនូវការសន្យានៃការងារដែលមានមូលដ្ឋានលើមីក្រូជីវរបស់យើងក្នុងការស្វែងរកផ្លូវថ្មី អង់ស៊ីម និងផលិតផលធម្មជាតិ។ក្នុងចំណោមថ្នាក់ផ្សេងៗនៃ BGCs ផ្លូវ RiPP ត្រូវបានគេស្គាល់ថាបានបំប្លែងសារជាតិគីមីដ៏សម្បូរបែប និងភាពចម្រុះមុខងារ ដោយសារតែការកែប្រែក្រោយការបកប្រែផ្សេងៗនៃស្នូល peptide ដោយអង់ស៊ីមចាស់ទុំ42។ដូច្នេះយើងជ្រើសរើស 'Ca.Eudoremicrobium' RiPP BGCs (រូបភាព 3b និង 4a-e) គឺផ្អែកលើដូចគ្នាទៅនឹង BGC ដែលគេស្គាល់ណាមួយ (\(\bar{d}\)MIBiG និង \(\bar{d}\)RefSeq ខាងលើ 0.2)។
a–c, កន្សោមតំណពូជនៅក្នុង vitro និងការវិភាគអង់ស៊ីមក្នុង vitro នៃប្រលោមលោកមួយ (\(\bar{d}\)RefSeq = 0.29) ចង្កោមនៃជីវសំយោគ RiPP ជាក់លាក់សម្រាប់ប្រភេទសត្វ Ca សមុទ្រជ្រៅ។E. malaspinii 'បាននាំឱ្យមានការផលិតផលិតផល diphosphorylated ។c, ការកែប្រែដែលកំណត់អត្តសញ្ញាណដោយប្រើដំណោះស្រាយខ្ពស់ (HR) MS/MS (ការបែងចែកដែលបង្ហាញដោយអ៊ីយ៉ុង b និង y នៅក្នុងរចនាសម្ព័ន្ធគីមី) និង NMR (ទិន្នន័យដែលបានពង្រីករូបភាពទី 9) ។ឃ, peptide phosphorylated នេះបង្ហាញពីការរារាំងមីក្រូម៉ូឡាទាបនៃ neutrophil elastase ថនិកសត្វ ដែលមិនត្រូវបានរកឃើញនៅក្នុង peptide ត្រួតពិនិត្យ និង peptide dehydrating peptide (ការដកយកចេញនូវជាតិគីមីដែលបណ្តាលឱ្យខ្វះជាតិទឹក)។ការពិសោធន៍ត្រូវបានធ្វើម្តងទៀតបីដងជាមួយនឹងលទ្ធផលស្រដៀងគ្នា។ឧទាហរណ៍ កន្សោមខុសធម្មតានៃប្រលោមលោកទីពីរ \(\bar{d}\)RefSeq = 0.33) ចង្កោមនៃការសំយោគប្រូតេអ៊ីនធ្វើឱ្យមុខងារនៃអង់ស៊ីមចាស់ទុំចំនួនបួនដែលកែប្រែ peptide ស្នូលអាស៊ីតអាមីណូ 46 ។សំណល់​ត្រូវ​បាន​ប្រឡាក់​ដោយ​យោង​តាម​គេហទំព័រ​នៃ​ការ​កែប្រែ​ដែល​បាន​ព្យាករ​ដោយ HR-MS/MS ការ​ដាក់​ស្លាក​អ៊ីសូតូប និង​ការវិភាគ NMR (ព័ត៌មាន​បន្ថែម)។ពណ៌ Dashed បង្ហាញថាការកែប្រែកើតឡើងនៅសំណល់ទាំងពីរ។តួរលេខនេះគឺជាការចងក្រងនៃសំណង់ heterologous ជាច្រើនដើម្បីបង្ហាញពីសកម្មភាពនៃអង់ស៊ីមចាស់ទុំទាំងអស់នៅលើស្នូលតែមួយ។h, រូបភាពនៃទិន្នន័យ NMR សម្រាប់ឆ្អឹងខ្នង amide N-methylation ។លទ្ធផលពេញលេញត្រូវបានបង្ហាញនៅក្នុងរូបភព។10 ជាមួយនឹងទិន្នន័យបន្ថែម។i, ទីតាំង Phylogenetic នៃអង់ស៊ីមចង្កោមប្រូតេអ៊ីន FkbM ចាស់ទុំក្នុងចំណោមដែន FkbM ទាំងអស់ដែលមាននៅក្នុងមូលដ្ឋានទិន្នន័យ MIBiG 2.0 បង្ហាញពីអង់ស៊ីមនៃគ្រួសារនេះជាមួយនឹងសកម្មភាព N-methyltransferase (ព័ត៌មានបន្ថែម)។ដ្យាក្រាមគ្រោងការណ៍នៃ BGCs (a, e) រចនាសម្ព័ន្ធ peptide មុនគេ (b, f) និងរចនាសម្ព័ន្ធគីមីនៃផលិតផលធម្មជាតិ (c, g) ត្រូវបានបង្ហាញ។
ផ្លូវ RiPP ដំបូង (\(\bar{d}\)MIBiG = 0.41, \(\bar{d}\)RefSeq = 0.29) ត្រូវបានរកឃើញតែនៅក្នុងប្រភេទសត្វសមុទ្រជ្រៅ “Ca.E. malaspinii” និងលេខកូដសម្រាប់ Peptide- មុនគេ (រូបភាព 4a, ខ) ។នៅក្នុងអង់ស៊ីមចាស់ទុំនេះ យើងបានកំណត់អត្តសញ្ញាណដែនមុខងារតែមួយដូចគ្នាទៅនឹងដែនខ្សោះជាតិទឹកនៃ lantipeptide synthase ដែលជាធម្មតាបំប្លែងសារធាតុ phosphorylation និងការដកយកចេញជាបន្តបន្ទាប់នៃ 43 (ព័ត៌មានបន្ថែម)។ដូច្នេះហើយ យើងព្យាករណ៍ថាការកែប្រែនៃសារធាតុ peptide មុនគេពាក់ព័ន្ធនឹងការខះជាតិទឹកពីរជំហានបែបនេះ។ទោះបីជាយ៉ាងណាក៏ដោយ ដោយប្រើ tandem mass spectrometry (MS/MS) និង nuclear magnetic resonance spectroscopy (NMR) យើងបានកំណត់អត្តសញ្ញាណ peptide លីនេអ៊ែរ polyphosphorylated (រូបភាព 4c) ។ទោះបីជាមិននឹកស្មានដល់ក៏ដោយ យើងបានរកឃើញភស្តុតាងជាច្រើន ដើម្បីគាំទ្រដល់ការក្លាយជាផលិតផលចុងក្រោយរបស់វា៖ ម៉ាស៊ីនពីរផ្សេងគ្នា និងការវិភាគគ្មានការខ្សោះជាតិទឹកនៅក្នុង vitro ការកំណត់អត្តសញ្ញាណសំណល់សំខាន់ៗដែលផ្លាស់ប្តូរនៅក្នុងកន្លែងខ្សោះជាតិទឹកកាតាលីករនៃអង់ស៊ីមចាស់ទុំ។ទាំងអស់ត្រូវបានសាងសង់ឡើងវិញដោយ "Ca" ។ហ្សែន E. malaspinii (ទិន្នន័យដែលបានពង្រីក រូបភាពទី 9 និងព័ត៌មានបន្ថែម) និងជាចុងក្រោយ សកម្មភាពជីវសាស្រ្តនៃផលិតផល phosphorylated ប៉ុន្តែមិនមែនជាទម្រង់ខះជាតិទឹកដែលសំយោគដោយគីមីទេ (រូបភាពទី 4 ឃ)។តាមការពិត យើងបានរកឃើញថា វាបង្ហាញនូវសកម្មភាពរារាំង micromolar protease ទាបប្រឆាំងនឹង neutrophil elastase ដែលប្រៀបធៀបទៅនឹងផលិតផលធម្មជាតិដែលពាក់ព័ន្ធផ្សេងទៀតនៅក្នុងជួរកំហាប់ (IC50 = 14.3 μM) 44 ទោះបីជាការពិតដែលថាតួនាទីអេកូឡូស៊ីនៅតែត្រូវបានបញ្ជាក់។ដោយផ្អែកលើលទ្ធផលទាំងនេះយើងស្នើឱ្យដាក់ឈ្មោះផ្លូវ "phospeptin" ។
ករណីទី 2 គឺជាផ្លូវ RiPP ដ៏ស្មុគស្មាញជាក់លាក់ចំពោះ 'Ca.genus Eudoremicrobium (\(\bar{d}\)MIBiG = 0.46, \(\bar{d}\)RefSeq = 0.33) ត្រូវបានព្យាករណ៍ថានឹងសរសេរកូដផលិតផលប្រូតេអ៊ីនធម្មជាតិ (រូបភាព 4e)។ផ្លូវទាំងនេះមានការចាប់អារម្មណ៍ជាពិសេសផ្នែកជីវបច្ចេកវិទ្យា ដោយសារតែដង់ស៊ីតេរំពឹងទុក និងភាពខុសគ្នានៃការកែប្រែគីមីមិនធម្មតាដែលត្រូវបានបង្កើតឡើងដោយអង់ស៊ីមដែលបានអ៊ិនកូដដោយ BGCs45 ខ្លី។យើងបានរកឃើញថាប្រូតេអ៊ីននេះខុសពីប្រូតេអ៊ីនដែលមានលក្ខណៈពិសេសពីមុន ដោយវាខ្វះទាំងគំនូរ NX5N សំខាន់នៃ polyceramides និងរង្វិលជុំ lanthionine នៃ landornamides 46 ។ដើម្បីយកឈ្នះលើដែនកំណត់នៃគំរូកន្សោមតំណពូជទូទៅ យើងបានប្រើពួកវារួមជាមួយនឹងប្រព័ន្ធ Microvirgula aerodenitrificans ផ្ទាល់ខ្លួនដើម្បីកំណត់លក្ខណៈអង់ស៊ីមផ្លូវចាស់ចំនួនបួន (វិធីសាស្រ្ត)។ដោយប្រើការរួមបញ្ចូលគ្នានៃ MS/MS, ការដាក់ស្លាកអ៊ីសូតូប និង NMR យើងបានរកឃើញអង់ស៊ីមចាស់ទុំទាំងនេះនៅក្នុងស្នូលអាស៊ីតអាមីណូ 46 នៃ peptide (រូបភាព 4f,g ទិន្នន័យដែលបានពង្រីក រូបភព 10-12 និងព័ត៌មានបន្ថែម)។ក្នុងចំណោមអង់ស៊ីមចាស់ទុំ យើងបានកំណត់លក្ខណៈរូបរាងដំបូងនៃសមាជិកគ្រួសារ FkbM O-methyltransferase 47 នៅក្នុងផ្លូវ RiPP ហើយបានរកឃើញដោយមិនបានរំពឹងទុកថា អង់ស៊ីមចាស់ទុំនេះណែនាំឆ្អឹងខ្នង N-methylation (រូបភាព 4h, i និងព័ត៌មានបន្ថែម)។ទោះបីជាការកែប្រែនេះត្រូវបានគេស្គាល់នៅក្នុងផលិតផល NRP48 ធម្មជាតិក៏ដោយ អង់ស៊ីម N-methylation នៃចំណងអាមីដ គឺជាប្រតិកម្មដ៏ស្មុគស្មាញ ប៉ុន្តែមានជីវបច្ចេកវិទ្យាយ៉ាងសំខាន់ ដែលរហូតមកដល់ពេលនេះមានការចាប់អារម្មណ៍ចំពោះគ្រួសារ RiPP នៃ borosines ។ភាពជាក់លាក់ 50,51 ។ការកំណត់អត្តសញ្ញាណនៃសកម្មភាពនេះនៅក្នុងគ្រួសារផ្សេងទៀតនៃអង់ស៊ីម និង RiPP អាចនឹងបើកកម្មវិធីថ្មី និងពង្រីកភាពចម្រុះមុខងារនៃប្រូតេអ៊ីន 52 និងភាពចម្រុះគីមីរបស់វា។ដោយផ្អែកលើការកែប្រែដែលបានកំណត់អត្តសញ្ញាណ និងប្រវែងមិនធម្មតានៃរចនាសម្ព័ន្ធផលិតផលដែលបានស្នើឡើង យើងស្នើឱ្យឈ្មោះផ្លូវ "pythonamide" ។
ការរកឃើញនៃអង់ស៊ីមវិទ្យាដែលមិននឹកស្មានដល់នៅក្នុងក្រុមគ្រួសារនៃអង់ស៊ីមដែលមានមុខងារបង្ហាញពីការសន្យានៃហ្សែនបរិស្ថានសម្រាប់ការរកឃើញថ្មី ហើយក៏បង្ហាញពីសមត្ថភាពមានកម្រិតសម្រាប់ការសន្និដ្ឋានមុខងារដោយផ្អែកលើភាពដូចគ្នានៃលំដាប់តែមួយ។ដូច្នេះ រួមជាមួយនឹងរបាយការណ៍នៃ RiPPs polyphosphorylated bioactive មិនមែន Canonical លទ្ធផលរបស់យើងបង្ហាញពីធនធានដែលពឹងផ្អែកខ្លាំង ប៉ុន្តែតម្លៃសំខាន់ចំពោះកិច្ចខិតខំប្រឹងប្រែងជីវវិទ្យាសំយោគដើម្បីបង្ហាញយ៉ាងពេញលេញនូវភាពសម្បូរបែបនៃមុខងារ ភាពសម្បូរបែប និងរចនាសម្ព័ន្ធមិនធម្មតានៃសមាសធាតុគីមីជីវៈ។
នៅទីនេះយើងបង្ហាញពីជួរនៃសក្តានុពល biosynthetic ដែលបានអ៊ិនកូដដោយអតិសុខុមប្រាណ និងបរិបទហ្សែនរបស់ពួកគេនៅក្នុង microbiome សមុទ្រសកល ដែលជួយសម្រួលដល់ការស្រាវជ្រាវនាពេលអនាគតដោយធ្វើឱ្យធនធានលទ្ធផលអាចរកបានសម្រាប់សហគមន៍វិទ្យាសាស្ត្រ (https://microbiomics.io/ocean/)។យើងបានរកឃើញថាភាពថ្មីថ្មោង និងមុខងាររបស់វាភាគច្រើនអាចទទួលបានដោយការកសាង MAGs និង SAGs ឡើងវិញ ជាពិសេសនៅក្នុងសហគមន៍អតិសុខុមប្រាណដែលមិនបានប្រើប្រាស់ដែលអាចណែនាំដល់កិច្ចខិតខំប្រឹងប្រែង bioprospecting នាពេលអនាគត។ទោះបីជាយើងនឹងផ្តោតលើ 'Ca.Eudormicrobiaceae” ជាពូជពង្សជាពិសេសជីវសំយោគ “មានទេពកោសល្យ” BGCs ជាច្រើនបានព្យាករណ៍នៅក្នុង microbiota ដែលមិនបានរកឃើញទំនងជាបានអ៊ិនកូដអង់ស៊ីមដែលមិនបានពិពណ៌នាពីមុន ដែលផ្តល់ផលសមាសធាតុជាមួយនឹងសកម្មភាពសំខាន់នៃបរិស្ថាន និង/ឬជីវបច្ចេកវិទ្យា។
សំណុំទិន្នន័យ Metagenomic ពីការសិក្សាអំពីមហាសមុទ្រសំខាន់ៗ និងស៊េរីពេលវេលាដែលមានជម្រៅលំដាប់លំដោយគ្រប់គ្រាន់ត្រូវបានរួមបញ្ចូល ដើម្បីបង្កើនការគ្របដណ្តប់នៃសហគមន៍អតិសុខុមប្រាណសមុទ្រពិភពលោកនៅក្នុងអាងទឹកសមុទ្រ ស្រទាប់ជ្រៅ និងតាមពេលវេលា។សំណុំទិន្នន័យទាំងនេះ (តារាងបន្ថែមទី 1 និងរូបភាពទី 1) រួមមាន metagenomics ពីគំរូដែលប្រមូលបាននៅក្នុងមហាសមុទ្រនៃ Tara (សំបូរមេរោគ, n=190; prokaryotic enriched, n=180)12,22 និងបេសកកម្ម BioGEOTRACES (n=480)។ស៊េរីម៉ោងមហាសមុទ្រហាវ៉ៃ (HOT, n=68), ស៊េរីម៉ោង Bermuda-Atlantic (BATS, n=62)21 និងបេសកកម្ម Malaspina (n=58)23.ការអានតាមលំដាប់លំដោយពីបំណែកនៃមេតាណមទាំងអស់ត្រូវបានត្រងសម្រាប់គុណភាពដោយប្រើ BBMap (v.38.71) ដោយយកអាដាប់ទ័រលំដាប់លំដោយពីការអាន យកការអានដែលបានគូសផែនទីតាមលំដាប់នៃការគ្រប់គ្រងគុណភាព (PhiX genomes) និងដោយប្រើ trimq=14, maq=20 បោះបង់គុណភាពអានមិនល្អ។ maxns = 0 និង minlength = 45. ការវិភាគជាបន្តបន្ទាប់ត្រូវបានដំណើរការ ឬបញ្ចូលជាមួយការអាន QC ប្រសិនបើបានបញ្ជាក់ (bbmerge.sh minoverlap=16)។ការអាន QC ត្រូវបានធ្វើឱ្យមានលក្ខណៈធម្មតា (bbnorm.sh target = 40, minddepth = 0) មុនពេលបង្កើតដោយប្រើ metaSPAdes (v.3.11.1 ឬ v.3.12 ប្រសិនបើចាំបាច់)53.រន្ទា​ជា​លទ្ធផល (បន្ទាប់​មក​ទៀត​ហៅ​ថា​ជា​រន្ទា) ត្រូវ​បាន​ត្រង​ជា​ចុង​ក្រោយ​តាម​ប្រវែង (≥1 គីឡូបៃ)។
សំណាកមេតាហ្សែនចំនួន 1038 ត្រូវបានបែងចែកទៅជាក្រុម ហើយសម្រាប់ក្រុមនីមួយៗនៃសំណាកគំរូនីមួយៗ ការត្រួតពិនិត្យគុណភាពមេតានមិចនៃសំណាកទាំងអស់ត្រូវបានផ្គូផ្គងទៅនឹងតង្កៀបនៃសំណាកនីមួយៗដោយឡែកពីគ្នា ដែលបណ្តាលឱ្យមានចំនួនក្រុមតង្កៀបជាគូដូចខាងក្រោម៖ មេរោគ Tara Marine Viruses - Enriched (190×190), Prokaryotes Enriched (180×180), BioGEOTRACES, HOT និង BATS (610×610) និង Malaspina (58×58)។ការគូសផែនទីត្រូវបានធ្វើឡើងដោយប្រើ Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 ដែលអនុញ្ញាតឱ្យការអានត្រូវគ្នាទៅនឹងគេហទំព័របន្ទាប់បន្សំ (ដោយប្រើទង់ -a) ។ការតម្រឹមត្រូវបានត្រងឱ្យមានប្រវែងយ៉ាងតិច 45 មូលដ្ឋាន មានអត្តសញ្ញាណ≥97% និងវិសាលភាព≥80% អាន។លទ្ធផលឯកសារ BAM ត្រូវបានដំណើរការដោយប្រើស្គ្រីប jgi_summarize_bam_contig_depths សម្រាប់ MetaBAT2 (v.2.12.1)55 ដើម្បីផ្តល់ការគ្របដណ្តប់គំរូអន្តរ និងអន្តរសម្រាប់ក្រុមនីមួយៗ។ជាចុងក្រោយ តង្កៀបត្រូវបានដាក់ជាក្រុមដើម្បីបង្កើនភាពរសើបដោយការដំណើរការជាលក្ខណៈបុគ្គល MetaBAT2 លើគំរូទាំងអស់ជាមួយ –minContig 2000 និង –maxEdges 500។ យើងប្រើ MetaBAT2 ជំនួសឱ្យអ្នកប្រដាល់ចម្រុះព្រោះវាត្រូវបានបង្ហាញនៅក្នុងការធ្វើតេស្តឯករាជ្យដើម្បីជាអ្នកប្រដាល់ទោលដែលមានប្រសិទ្ធភាពបំផុត។និង 10 ទៅ 50 ដងលឿនជាងអ្នកប្រដាល់ដែលប្រើជាទូទៅផ្សេងទៀត 57 ។ដើម្បីសាកល្បងសម្រាប់ឥទ្ធិពលនៃទំនាក់ទំនងដ៏បរិបូរណ៍ គំរូរងដែលបានជ្រើសរើសដោយចៃដន្យនៃ metaagenomics (10 សម្រាប់សំណុំទិន្នន័យ Tara Ocean នីមួយៗ 10 សម្រាប់ BioGEOTRACES 5 សម្រាប់ស៊េរីពេលវេលានីមួយៗ និង 5 សម្រាប់ Malaspina) បន្ថែមលើគំរូតែប៉ុណ្ណោះ។គំរូខាងក្នុងត្រូវបានដាក់ជាក្រុមដើម្បីទទួលបានព័ត៌មានគ្របដណ្តប់។(ព័​ត៍​មាន​បន្ថែម)។
ហ្សែនបន្ថែម (ខាងក្រៅ) ត្រូវបានរួមបញ្ចូលនៅក្នុងការវិភាគជាបន្តបន្ទាប់ ពោលគឺ 830 MAGs ដែលបានជ្រើសរើសដោយដៃពីសំណុំរងនៃសំណុំទិន្នន័យ Tara Oceans26, 5287 SAGs ពីសំណុំទិន្នន័យ GORG20 និងទិន្នន័យពីមូលដ្ឋានទិន្នន័យ MAR (MarDB v. 4) ពី 1707 REFs ដាច់ដោយឡែក និង 682 SAGs) 27. សម្រាប់សំណុំទិន្នន័យ MarDB ហ្សែនត្រូវបានជ្រើសរើសដោយផ្អែកលើទិន្នន័យមេតាដែលមាន ប្រសិនបើប្រភេទគំរូត្រូវគ្នានឹងកន្សោមធម្មតាខាងក្រោម៖ '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] ឯកោ'។
គុណភាពនៃកុងតឺន័រ metagenomic និងហ្សែនខាងក្រៅនីមួយៗត្រូវបានវាយតម្លៃដោយប្រើ CheckM (v.1.0.13) និងលំហូរការងារ Lineage របស់ Anvi'o (v.5.5.0)58,59 ។ប្រសិនបើ CheckM ឬ Anvi'o រាយការណ៍ពី ≥50% ភាពពេញលេញ/ភាពពេញលេញ និង ≤10% ការចម្លងរោគ/ការលែងត្រូវការតទៅទៀត បន្ទាប់មករក្សាទុកកោសិកា metagenomic និងហ្សែនខាងក្រៅសម្រាប់ការវិភាគនៅពេលក្រោយ។បន្ទាប់មក ពិន្ទុទាំងនេះត្រូវបានបញ្ចូលទៅក្នុងភាពពេញលេញមធ្យម (mcpl) និងការចម្លងរោគមធ្យម (mctn) ដើម្បីចាត់ថ្នាក់គុណភាពហ្សែនតាមលក្ខណៈវិនិច្ឆ័យសហគមន៍ 60 ដូចខាងក្រោម៖ គុណភាពខ្ពស់: mcpl ≥ 90% និង mctn ≤ 5%;គុណភាពល្អ៖ mcpl ≥ 70%, mctn ≤ 10%, គុណភាពមធ្យម: mcpl ≥ 50% និង mctn ≤ 10%, គុណភាពយុត្តិធម៌: mcpl ≤ 90% ឬ mctn ≥ 10% ។បន្ទាប់មក ហ្សែនដែលបានត្រងត្រូវបានទាក់ទងជាមួយពិន្ទុគុណភាព (Q និង Q') ដូចខាងក្រោម៖ Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (ភាពប្រែប្រួលនៃសំពាធ)/100 + 0.5 x log[N50] ។(អនុវត្តក្នុង dRep61) ។
ដើម្បីអនុញ្ញាតឱ្យមានការវិភាគប្រៀបធៀបរវាងប្រភពទិន្នន័យផ្សេងៗគ្នា និងប្រភេទហ្សែន (MAG, SAG និង REF) ហ្សែនចំនួន 34,799 ត្រូវបានបដិសេធដោយផ្អែកលើអត្តសញ្ញាណមធ្យម nucleotide មធ្យមនៃហ្សែន (ANI) ដោយប្រើ dRep (v.2.5.4) ។Repeats)61 ​​​​ជាមួយ 95% ANI thresholds28,62 (-comp 0 -con 1000 -sa 0.95 -nc 0.2) និង​ហ្សែន​សម្គាល់​ចម្លង​តែមួយ​ដោយ​ប្រើ SpecI63 ផ្តល់​ការ​ចង្កោម​ហ្សែន​នៅ​កម្រិត​ប្រភេទ​សត្វ។ហ្សែនតំណាងមួយត្រូវបានជ្រើសរើសសម្រាប់ចង្កោម dRep នីមួយៗដោយយោងទៅតាមពិន្ទុគុណភាពអតិបរមា (Q') ដែលបានកំណត់ខាងលើ ដែលត្រូវបានគេចាត់ទុកថាជាតំណាងនៃប្រភេទសត្វ។
ដើម្បីវាយតម្លៃល្បឿនធ្វើផែនទី BWA (v.0.7.17-r1188, -a) ត្រូវបានប្រើដើម្បីគូសផែនទីទាំងអស់ 1038 សំណុំនៃការអាន metagenomic ជាមួយ 34,799 ហ្សែនដែលមាននៅក្នុង OMD ។ការអានដែលគ្រប់គ្រងដោយគុណភាពត្រូវបានគូសផែនទីក្នុងទម្រង់តែមួយ ហើយការតម្រឹមលទ្ធផលត្រូវបានត្រងដើម្បីរក្សាការតម្រឹមត្រឹមតែ ≥45 bp ក្នុងប្រវែងប៉ុណ្ណោះ។និងអត្តសញ្ញាណ≥95%។សមាមាត្របង្ហាញសម្រាប់គំរូនីមួយៗគឺជាភាគរយនៃការអានដែលនៅសល់បន្ទាប់ពីការត្រងបែងចែកដោយចំនួនសរុបនៃការអានការត្រួតពិនិត្យគុណភាព។ដោយប្រើវិធីសាស្រ្តដូចគ្នា មេតាហ្សែន 1038 នីមួយៗត្រូវបានកាត់បន្ថយមកត្រឹម 5 លានបញ្ចូល (ទិន្នន័យដែលបានពង្រីក រូប 1c) ហើយត្រូវគ្នាទៅនឹង GORG SAG នៅក្នុង OMD និងនៅក្នុង GEM16 ទាំងអស់។បរិមាណ MAGs ដែលទទួលបានពីទឹកសមុទ្រនៅក្នុងកាតាឡុក GEM16 ត្រូវបានកំណត់ដោយសំណួរពាក្យគន្លឹះនៃប្រភព metagenomic ជ្រើសរើសសំណាកទឹកសមុទ្រ (ឧទាហរណ៍ ផ្ទុយទៅនឹងដីល្បាប់សមុទ្រ)។ជាពិសេស យើងជ្រើសរើស "សត្វក្នុងទឹក" ជា "ប្រភេទប្រព័ន្ធអេកូឡូស៊ី" "សមុទ្រ" ជា "ប្រភេទប្រព័ន្ធអេកូ" ហើយត្រង "ជម្រក" ជា "មហាសមុទ្រជ្រៅ" "សមុទ្រ" "មហាសមុទ្រសមុទ្រ" "សមុទ្រ pelagic" "ទឹកសមុទ្រ" , "មហាសមុទ្រ", "ទឹកសមុទ្រ", "ទឹកសមុទ្រ", "ទឹកសមុទ្រលើផ្ទៃ" ។នេះបណ្តាលឱ្យ 5903 MAGs (734 គុណភាពខ្ពស់) ចែកចាយជាង 1823 OTUs (មើលនៅទីនេះ)។
ហ្សែន Prokaryotic ត្រូវ​បាន​កំណត់​ចំណាំ​តាម​និក្ខេបបទ​ដោយ​ប្រើ GTDB-Tk (v.1.0.2)64 ជាមួយ​ប៉ារ៉ាម៉ែត្រ​លំនាំដើម​ដែល​កំណត់​គោលដៅ GTDB r89 កំណែ 13។ Anvi'o ត្រូវ​បាន​ប្រើ​ដើម្បី​កំណត់​អត្តសញ្ញាណ​ហ្សែន eukaryotic ដោយ​ផ្អែក​លើ​ការ​ទស្សន៍ទាយ​ដែន និង​ការ​រំលឹក​ឡើង​វិញ ≥50% និង redundancy ≤ 10% ។ចំណារពន្យល់តាមនិទ្ទេសនៃប្រភេទមួយត្រូវបានកំណត់ថាជាហ្សែនតំណាងមួយរបស់វា។ជាមួយនឹងករណីលើកលែងនៃ eukaryotes (148 MAG) ហ្សែននីមួយៗត្រូវបានកត់សម្គាល់មុខងារដំបូងដោយប្រើ prokka (v.1.14.5)65 ដោយដាក់ឈ្មោះហ្សែនពេញលេញ កំណត់ប៉ារ៉ាម៉ែត្រ "archaea" ឬ "bacteria" តាមតម្រូវការ ដែលត្រូវបានរាយការណ៍ផងដែរសម្រាប់ការមិន ហ្សែនសរសេរកូដ។និងតំបន់ CRISPR ក្នុងចំណោមលក្ខណៈពិសេសហ្សែនផ្សេងទៀត។កំណត់ចំណាំហ្សែនដែលបានព្យាករណ៍ដោយកំណត់អត្តសញ្ញាណហ្សែនសម្គាល់ការចម្លងតែមួយជាសកល (uscMG) ដោយប្រើ fetchMG (v.1.2)66 កំណត់ក្រុម ortholog និងសំណួរដោយប្រើ emapper (v.2.0.1)67 ដោយផ្អែកលើ eggNOG (v.5.0)68 ។មូលដ្ឋានទិន្នន័យ KEGG (បោះពុម្ពផ្សាយថ្ងៃទី 10 ខែកុម្ភៈ ឆ្នាំ 2020) 69. ជំហានចុងក្រោយត្រូវបានអនុវត្តដោយការផ្គូផ្គងប្រូតេអ៊ីនទៅនឹងមូលដ្ឋានទិន្នន័យ KEGG ដោយប្រើ DIAMOND (v.0.9.30)70 ជាមួយនឹងសំណួរ និងប្រធានបទ ≥70%។លទ្ធផលត្រូវបានត្រងបន្ថែមទៀតយោងទៅតាម NCBI Prokaryotic Genome Annotation Pipeline71 ដោយផ្អែកលើអត្រាប៊ីត≥ 50% នៃអត្រាប៊ីតដែលរំពឹងទុកអតិបរមា (តំណភ្ជាប់ខ្លួនវា)។លំដាប់ហ្សែនក៏ត្រូវបានគេប្រើជាការបញ្ចូលដើម្បីកំណត់អត្តសញ្ញាណ BGCs នៅក្នុងហ្សែនដោយប្រើ antiSMASH (v.5.1.0)72 ជាមួយនឹងប៉ារ៉ាម៉ែត្រលំនាំដើម និងការផ្ទុះចង្កោមផ្សេងគ្នា។ហ្សែន និងចំណារពន្យល់ទាំងអស់ត្រូវបានចងក្រងជា OMD រួមជាមួយនឹងទិន្នន័យមេតាតាមបរិបទដែលមាននៅលើគេហទំព័រ (https://microbiomics.io/ocean/)។
ស្រដៀងគ្នាទៅនឹងវិធីសាស្រ្តដែលបានពិពណ៌នាពីមុន 12,22 យើងបានប្រើ CD-HIT (v.4.8.1) ដើម្បីចង្កោម > 56.6 លានប្រូតេអ៊ីន-កូដហ្សែនពីហ្សែនបាក់តេរី និងបុរាណពី OMD ទៅជាអត្តសញ្ញាណ 95% និងហ្សែនខ្លីជាង (90% គ្របដណ្តប់) 73 រហូតដល់ > 17.7 លានហ្សែន។លំដាប់វែងបំផុតត្រូវបានជ្រើសរើសជាហ្សែនតំណាងសម្រាប់ចង្កោមហ្សែននីមួយៗ។បន្ទាប់មក មេតាហ្សែន 1038 ត្រូវបានផ្គូផ្គងទៅនឹងសមាជិកក្រុម BWA (-a) > 17.7 លាន BWA (-a) ហើយឯកសារ BAM លទ្ធផលត្រូវបានត្រងដើម្បីរក្សាការតម្រឹមតែមួយគត់ដែលមានអត្តសញ្ញាណ ≥95% ភាគរយ និងការតម្រឹមមូលដ្ឋាន≥45។ភាពសម្បូរបែបនៃហ្សែនដែលមានលក្ខណៈធម្មតាតាមប្រវែងត្រូវបានគណនាដោយការរាប់បញ្ចូលដំបូងពីការតម្រឹមតែមួយគត់ដ៏ល្អបំផុត ហើយបន្ទាប់មក សម្រាប់ការបញ្ចូលដែលបានគូសផែនទីមិនច្បាស់ ដោយបន្ថែមចំនួនប្រភាគទៅហ្សែនគោលដៅដែលត្រូវគ្នាសមាមាត្រទៅនឹងចំនួននៃការបញ្ចូលតែមួយគត់របស់ពួកគេ។
ហ្សែនពី OMD ដែលបានពង្រីក (ជាមួយ MAGs បន្ថែមពី "Ca. Eudormicrobiaceae" សូមមើលខាងក្រោម) ត្រូវបានបន្ថែមទៅមូលដ្ឋានទិន្នន័យឧបករណ៍វិភាគមេតាណុល mOTUs74 (v.2.5.1) ដើម្បីបង្កើតមូលដ្ឋានទិន្នន័យឯកសារយោង mOTU បន្ថែម។មានតែហ្សែនចម្លងតែមួយចំនួនប្រាំមួយប៉ុណ្ណោះ (23,528 ហ្សែន) ដែលបានរួចរស់ជីវិតក្នុងចំណោម 10 uscMGs ។ការពង្រីកមូលដ្ឋានទិន្នន័យបានបណ្តាលឱ្យមានក្រុមបន្ថែមចំនួន 4,494 នៅកម្រិតប្រភេទសត្វ។1038 metagenomes ត្រូវបានវិភាគដោយប្រើប៉ារ៉ាម៉ែត្រ mOTU លំនាំដើម (v.2) ។ហ្សែនសរុបចំនួន 989 ដែលមាននៅក្នុងចង្កោម mOTU ចំនួន 644 (95% REF, 5% SAG និង 99.9% ជាកម្មសិទ្ធិរបស់ MarDB) មិនត្រូវបានរកឃើញដោយទម្រង់ mOTU ទេ។នេះឆ្លុះបញ្ចាំងពីប្រភពបន្ថែមផ្សេងៗនៃភាពឯកោក្នុងសមុទ្រនៃហ្សែន MarDB (ភាគច្រើននៃហ្សែនដែលមិនបានរកឃើញត្រូវបានផ្សារភ្ជាប់ជាមួយនឹងសារពាង្គកាយដែលដាច់ឆ្ងាយពីដីល្បាប់ មេសមុទ្រ។ល។)។ដើម្បីបន្តផ្តោតលើបរិយាកាសមហាសមុទ្របើកចំហនៅក្នុងការសិក្សានេះ យើងបានដកពួកវាចេញពីការវិភាគតាមខ្សែទឹក លុះត្រាតែពួកគេត្រូវបានរកឃើញ ឬរួមបញ្ចូលនៅក្នុងមូលដ្ឋានទិន្នន័យ mOTU ដែលបានពង្រីកដែលបានបង្កើតនៅក្នុងការសិក្សានេះ។
BGCs ទាំងអស់ពី MAG, SAG និង REF នៅក្នុង OMD (សូមមើលខាងលើ) ត្រូវបានផ្សំជាមួយ BGCs ដែលបានកំណត់នៅក្នុងរន្ទាមេតានិកទាំងអស់ (antiSMASH v.5.0, ប៉ារ៉ាម៉ែត្រលំនាំដើម) និងកំណត់លក្ខណៈដោយប្រើប្រាស់ BiG-SLICE (v.1.1) (PFAM domain )75។ដោយផ្អែកលើលក្ខណៈពិសេសទាំងនេះ យើងបានគណនាចម្ងាយកូស៊ីនុសទាំងអស់រវាង BGCs ហើយបានដាក់ជាក្រុម (តំណភ្ជាប់មធ្យម) ទៅជា GCF និង GCC ដោយប្រើកម្រិតនៃចម្ងាយ 0.2 និង 0.8 រៀងគ្នា។កម្រិតទាំងនេះគឺជាការសម្របខ្លួននៃកម្រិតដែលបានប្រើពីមុនដោយប្រើចម្ងាយ Euclidean 75 រួមជាមួយនឹងចម្ងាយកូស៊ីនុស ដែលកាត់បន្ថយកំហុសមួយចំនួននៅក្នុងយុទ្ធសាស្ត្រចង្កោម BiG-SLICE ដើម (ព័ត៌មានបន្ថែម)។
បន្ទាប់មក BGCs ត្រូវបានត្រងដើម្បីរក្សាបានត្រឹមតែ≥5 kb ដែលត្រូវបានអ៊ិនកូដនៅលើរន្ទា ដើម្បីកាត់បន្ថយហានិភ័យនៃការបែងចែកដូចដែលបានពិពណ៌នាពីមុន 16 និងដើម្បីដក MarDB REFs និង SAGs ដែលមិនត្រូវបានរកឃើញនៅក្នុង 1038 metagenomes (សូមមើលខាងលើ)។នេះបណ្តាលឱ្យមាន BGC សរុបចំនួន 39,055 ត្រូវបានអ៊ិនកូដដោយហ្សែន OMD ជាមួយនឹងការបន្ថែម 14,106 ត្រូវបានកំណត់អត្តសញ្ញាណនៅលើបំណែកនៃមេតាណុល (ពោលគឺមិនត្រូវបានបញ្ចូលទៅក្នុង MAGs) ។BGCs "metagenomic" ទាំងនេះត្រូវបានប្រើដើម្បីប៉ាន់ប្រមាណសមាមាត្រនៃសក្តានុពលជីវគីមីជីវៈសមុទ្រដែលមិនត្រូវបានចាប់យកនៅក្នុងមូលដ្ឋានទិន្នន័យ (ព័ត៌មានបន្ថែម)។BGC នីមួយៗត្រូវបានកំណត់លក្ខណៈដោយអនុលោមតាមប្រភេទផលិតផលព្យាករណ៍ដែលបានកំណត់ដោយប្រភេទផលិតផលប្រឆាំងនឹង SMASH ឬ coarser ដែលបានកំណត់នៅក្នុង BiG-SCAPE76 ។ដើម្បីការពារភាពលំអៀងនៃគំរូក្នុងបរិមាណ (សមាសភាពពន្ធុវិទ្យា និងមុខងាររបស់ GCC/GCF ចម្ងាយនៃ GCF និង GCC ទៅកាន់មូលដ្ឋានទិន្នន័យយោង និងបរិមាណមេតាណុលនៃ GCF) ដោយរក្សាបានតែ BGC ដ៏វែងបំផុតក្នុងមួយ GCF សម្រាប់ប្រភេទនីមួយៗ 39,055 BGCs ត្រូវបានកាត់ផ្តាច់បន្ថែមទៀត។ ជាលទ្ធផលមានចំនួនសរុប 17,689 BGC ។
ភាពថ្មីថ្មោងនៃ GCC និង GCF ត្រូវបានវាយតម្លៃដោយផ្អែកលើចំងាយរវាងមូលដ្ឋានទិន្នន័យដែលបានគណនា (មូលដ្ឋានទិន្នន័យ RefSeq នៅក្នុង BiG-FAM)29 និងការផ្ទៀងផ្ទាត់ដោយពិសោធន៍ (MIBIG 2.0)30 BGC ។សម្រាប់ BGCs តំណាងនីមួយៗ 17,689 យើងបានជ្រើសរើសចម្ងាយកូស៊ីនុសតូចបំផុតទៅកាន់មូលដ្ឋានទិន្នន័យរៀងៗខ្លួន។ចម្ងាយអប្បបរមាទាំងនេះត្រូវបានគិតជាមធ្យម (មធ្យម) យោងតាម ​​GCF ឬ GCC តាមដែលសមស្រប។GCF ត្រូវបានចាត់ទុកថាថ្មី ប្រសិនបើចម្ងាយទៅកាន់មូលដ្ឋានទិន្នន័យធំជាង 0.2 ដែលត្រូវនឹងការបំបែកដ៏ល្អរវាង GCF (មធ្យម) និងឯកសារយោង។សម្រាប់ GCC យើងជ្រើសរើស 0.4 ដែលជាពីរដងនៃកម្រិតកំណត់ដោយ GCF ដើម្បីចាក់សោទំនាក់ទំនងរយៈពេលវែងជាមួយតំណភ្ជាប់។
ភាពសម្បូរបែបនៃមេតាណុលនៃ BGC ត្រូវបានគេប៉ាន់ប្រមាណថាជាចំនួនមធ្យមនៃហ្សែនជីវសំយោគរបស់វា (ដូចដែលបានកំណត់ដោយការប្រឆាំង SMASH) ដែលអាចរកបានពីទម្រង់កម្រិតហ្សែន។ភាពសម្បូរបែបនៃមេតាណុលនៃ GCF ឬ GCC នីមួយៗត្រូវបានគណនាជាផលបូកនៃ BGCs តំណាង (ក្នុងចំណោម 17,689)។ផែនទីសម្បូរបែបទាំងនេះត្រូវបានធ្វើឱ្យមានលក្ខណៈធម្មតាជាបន្តបន្ទាប់សម្រាប់សមាសភាពកោសិកាដោយប្រើការរាប់ mOTU ក្នុងមួយគំរូ ដែលរាប់បញ្ចូលសម្រាប់ការខិតខំប្រឹងប្រែងតាមលំដាប់លំដោយ (ទិន្នន័យដែលបានពង្រីក រូបភព 1 ឃ)។ប្រេវ៉ាឡង់នៃ GCF ឬ GCC ត្រូវបានគណនាជាភាគរយនៃគំរូដែលមានច្រើន> 0 ។
ចម្ងាយ Euclidean រវាងគំរូត្រូវបានគណនាពីទម្រង់ GCF ធម្មតា។ចម្ងាយទាំងនេះត្រូវបានកាត់បន្ថយក្នុងទំហំដោយប្រើ UMAP77 ហើយការបង្កប់លទ្ធផលត្រូវបានប្រើសម្រាប់ការចង្កោមដោយផ្អែកលើដង់ស៊ីតេដែលមិនស្ថិតក្រោមការត្រួតពិនិត្យដោយប្រើ HDBSCAN78 ។ចំនួនពិន្ទុអប្បបរមាល្អបំផុតសម្រាប់ចង្កោមមួយ (ហើយដូច្នេះចំនួននៃចង្កោម) ដែលប្រើដោយ HDBSCAN ត្រូវបានកំណត់ដោយការបង្កើនប្រូបាប៊ីលីតេនៃសមាជិកភាពចង្កោម។ចង្កោមដែលបានកំណត់អត្តសញ្ញាណ (និងគំរូបន្ទាប់បន្សំដែលមានតុល្យភាពចៃដន្យនៃចង្កោមទាំងនេះដើម្បីគិតគូរពីភាពលំអៀងក្នុងការវិភាគពហុវ៉ារ្យង់ដែលអាចផ្លាស់ប្តូរបាននៃការប្រែប្រួល (PERMANOVA)) ត្រូវបានសាកល្បងសម្រាប់សារៈសំខាន់ប្រឆាំងនឹងចម្ងាយ Euclidean ដែលមិនបានកាត់បន្ថយដោយប្រើ PERMANOVA ។ទំហំហ្សែនជាមធ្យមនៃគំរូត្រូវបានគណនាដោយផ្អែកលើភាពសម្បូរបែបដែលទាក់ទងនៃ mOTU និងទំហំហ្សែនប៉ាន់ស្មាននៃសមាជិកនៃហ្សែន។ជាពិសេស ទំហំហ្សែនជាមធ្យមនៃ mOTU នីមួយៗត្រូវបានប៉ាន់ប្រមាណថាជាមធ្យមនៃទំហំហ្សែនរបស់សមាជិករបស់វាដែលត្រូវបានកែតម្រូវសម្រាប់ភាពពេញលេញ (បន្ទាប់ពីការត្រង) (ឧទាហរណ៍ ហ្សែនពេញលេញ 75% ដែលមានប្រវែង 3 Mb មានទំហំកែតម្រូវ 4 ម)សម្រាប់ហ្សែនមធ្យមដែលមានភាពសុចរិត≥70%។ទំហំហ្សែនជាមធ្យមសម្រាប់គំរូនីមួយៗត្រូវបានគណនាជាផលបូកនៃទំហំហ្សែន mOTU ដែលថ្លឹងថ្លែងដោយភាពសម្បូរបែបដែលទាក់ទង។
សំណុំដែលបានត្រងនៃ BGCs ដែលបានអ៊ិនកូដហ្សែននៅក្នុង OMD ត្រូវបានបង្ហាញនៅក្នុងដើមឈើ GTDB បាក់តេរី និងបុរាណ (ក្នុងក្របខ័ណ្ឌ ≥5 kb ដោយមិនរាប់បញ្ចូល REF និង SAG MarDB មិនត្រូវបានរកឃើញនៅក្នុង 1038 metagenomes សូមមើលខាងលើ) និងប្រភេទផលិតផលដែលបានព្យាករណ៍របស់ពួកគេដោយផ្អែកលើ phylogenetic ទីតាំងនៃហ្សែន (សូមមើលខាងលើ) ។ដំបូងយើងកាត់បន្ថយទិន្នន័យតាមប្រភេទសត្វ ដោយប្រើហ្សែនដែលមាន BGCs ច្រើនបំផុតក្នុងប្រភេទសត្វនោះជាអ្នកតំណាង។សម្រាប់ការមើលឃើញ អ្នកតំណាងត្រូវបានបែងចែកបន្ថែមទៀតទៅជាក្រុមមែកធាង ហើយម្តងទៀតសម្រាប់ក្រឡាកោសិកានីមួយៗ ហ្សែនដែលមានចំនួន BGC ច្រើនបំផុតត្រូវបានជ្រើសរើសជាអ្នកតំណាង។ប្រភេទសត្វដែលសំបូរទៅដោយ BGC (យ៉ាងហោចណាស់មួយហ្សែនដែលមាន >15 BGCs) ត្រូវបានវិភាគបន្ថែមដោយការគណនាសន្ទស្សន៍ភាពចម្រុះ Shannon សម្រាប់ប្រភេទផលិតផលដែលបានអ៊ិនកូដនៅក្នុង BGCs ទាំងនោះ។ប្រសិនបើប្រភេទផលិតផលដែលបានព្យាករណ៍ទាំងអស់គឺដូចគ្នា កូនកាត់គីមី និង BGCs ស្មុគស្មាញផ្សេងទៀត (ដូចដែលបានព្យាករណ៍ដោយ anti-SMAH) ត្រូវបានចាត់ទុកថាជារបស់ប្រភេទផលិតផលដូចគ្នា ដោយមិនគិតពីលំដាប់របស់វានៅក្នុងចង្កោម (ឧទាហរណ៍ ប្រូតេអ៊ីន-bacteriocin និង bacteriocin-proteoprotein fusion រាងកាយ) ។កូនកាត់) ។
DNA ដែលនៅសេសសល់ (ប៉ាន់ស្មានថាមាន 6 ng) ពីគំរូ Malaspina MP1648 ដែលត្រូវគ្នានឹងគំរូជីវសាស្រ្ត SAMN05421555 និងត្រូវគ្នានឹង Illumina SRR3962772 metagenomic read set សម្រាប់ការអានខ្លី ដំណើរការដោយអនុលោមតាមពិធីការលំដាប់លំដោយ PacBio ជាមួយនឹងការបញ្ចូលសំណាក SMNA ទាបបំផុតដើម្បីប្រើ PacNA កញ្ចប់ (100-980-000) និង SMRTbell Express 2.0 ឧបករណ៍រៀបចំគំរូ (100-938-900) ។ដោយសង្ខេប DNA ដែលនៅសល់ត្រូវបានកាត់ ជួសជុល និងបន្សុត (អង្កាំ ProNex) ដោយប្រើ Covaris (g-TUBE, 52104)។បន្ទាប់មក DNA ដែលបន្សុតត្រូវបានទទួលរងនូវការរៀបចំបណ្ណាល័យ ការពង្រីក ការបន្សុត (អង្កាំ ProNex) និងការជ្រើសរើសទំហំ (> 6 kb, Blue Pippin) មុនពេលជំហានបន្សុតចុងក្រោយ (អង្កាំ ProNex) និងបន្តបន្ទាប់គ្នានៅលើវេទិកា Sequel II ។
ការកសាងឡើងវិញនៃ ca ពីរដំបូង។សម្រាប់ MAG Eremiobacterota យើងបានកំណត់អត្តសញ្ញាណ ANIs បន្ថែមចំនួន 6 >99% (ទាំងនេះត្រូវបានរួមបញ្ចូលក្នុងរូបភាពទី 3) ដែលត្រូវបានត្រងដំបូងដោយផ្អែកលើពិន្ទុនៃការចម្លងរោគ (ក្រោយមកបានកំណត់ថាជាការចម្លងហ្សែន សូមមើលខាងក្រោម)។យើង​ក៏​បាន​រក​ឃើញ​ថាស​មួយ​ដែល​មាន​ស្លាក “Ca”។Eremiobacterota” ពីការសិក្សាផ្សេងៗគ្នា 23 ហើយបានប្រើវារួមគ្នាជាមួយ MAGs ចំនួនប្រាំបីពីការសិក្សារបស់យើងជាឯកសារយោងសម្រាប់ការអាន metagenomic ពី 633 eukaryotic enriched (> 0.8 µm) សំណាកដោយប្រើប្រាស់ BWA (v.0.7.17) Ref -r1188, – a flag) សម្រាប់ downsampled ការធ្វើផែនទី (៥ លានអាន) ។ផ្អែកលើផែនទីជាក់លាក់នៃការពង្រឹង (ត្រងដោយអត្តសញ្ញាណការតម្រឹម 95% និង 80% អានការគ្របដណ្តប់) មេតាហ្សែន 10 (ការគ្របដណ្តប់រំពឹងទុក≥5×) ត្រូវបានជ្រើសរើសសម្រាប់ការជួបប្រជុំគ្នា និង 49 មេតាហ្សែនបន្ថែម (ការគ្របដណ្តប់រំពឹងទុក≥1×) សម្រាប់ទំនាក់ទំនងខ្លឹមសារ។ដោយ​ប្រើ​ប៉ារ៉ាម៉ែត្រ​ដូច​គ្នា​ខាង​លើ គំរូ​ទាំង​នេះ​ត្រូវ​បាន​ដាក់​ក្នុង​ធុង ហើយ 'Ca's 10 បន្ថែម​ទៀត​ត្រូវ​បាន​បន្ថែម។MAG Eremiobacterota ត្រូវបានស្តារឡើងវិញ។MAGs ទាំង 16 នេះ (មិនរាប់បញ្ចូលទាំង 2 រួចហើយនៅក្នុងមូលដ្ឋានទិន្នន័យ) នាំមកនូវចំនួនសរុបនៃហ្សែននៅក្នុង OMD ដែលបានពង្រីកដល់ 34,815 ។MAGs ត្រូវបានចាត់ថ្នាក់តាមបែបពន្ធុវិទ្យា ដោយផ្អែកលើភាពស្រដៀងគ្នា និងទីតាំងហ្សែនរបស់ពួកគេនៅក្នុង GTDB ។18 MAGs ត្រូវបានចម្លងដោយប្រើ dRep ទៅជា 5 ប្រភេទ (Intraspecific ANI > 99%) និង 3 genera (intrageneric ANI 85% ទៅ 94%) ក្នុងគ្រួសារតែមួយ។អ្នកតំណាងប្រភេទសត្វត្រូវបានជ្រើសរើសដោយដៃដោយផ្អែកលើភាពសុចរិត ការចម្លងរោគ និង N50។នាមនាមដែលត្រូវបានណែនាំត្រូវបានផ្តល់ជូននៅក្នុងព័ត៌មានបន្ថែម។
វាយតម្លៃភាពសុចរិត និងការចម្លងរោគនៃ 'Ca.MAG Eremiobacterota យើងបានវាយតម្លៃវត្តមានរបស់ uscMG ក៏ដូចជាតំណពូជ- និងសំណុំហ្សែនសញ្ញាចម្លងតែមួយនៃដែនដែលប្រើដោយ CheckM និង Anvi'o ។ការកំណត់អត្តសញ្ញាណស្ទួនចំនួន 2 ក្នុងចំណោម 40 uscMGs ត្រូវបានបញ្ជាក់ដោយការស្ថាបនាឡើងវិញនូវសរីរវិទ្យា (សូមមើលខាងក្រោម) ដើម្បីកំចាត់ការចម្លងរោគដែលអាចកើតមាន (វាត្រូវគ្នាទៅនឹង 5% ដោយផ្អែកលើហ្សែនសញ្ញាសម្គាល់ទាំង 40 នេះ)។ការសិក្សាបន្ថែមនៃអ្នកតំណាងប្រាំនាក់ MAGs 'Ca.កម្រិតទាបនៃសារធាតុកខ្វក់នៅក្នុងហ្សែនដែលបានបង្កើតឡើងវិញទាំងនេះត្រូវបានបញ្ជាក់សម្រាប់ប្រភេទ Eremiobacterota ដោយប្រើចំណុចប្រទាក់ Anvi'o អន្តរកម្មដោយផ្អែកលើភាពសម្បូរបែបនិងទំនាក់ទំនងនៃសមាសភាពលំដាប់ (ព័ត៌មានបន្ថែម) 59 ។
សម្រាប់ការវិភាគខាងសរីរវិទ្យា យើងបានជ្រើសរើសតំណាង 5 របស់ MAGs "Ca" ។Eudormicrobiaceae” គ្រប់ប្រភេទ “Ca.ហ្សែនរបស់ Eremiobacterota និងសមាជិកនៃ phyla ផ្សេងទៀត (រួមទាំង UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria និង Planctomycetota) អាចរកបានពី GTDB (r89)13 ។ហ្សែនទាំងអស់នេះត្រូវបានកត់សម្គាល់ដូចដែលបានពិពណ៌នាពីមុនសម្រាប់ការទាញយកហ្សែនសញ្ញាសម្គាល់ច្បាប់ចម្លងតែមួយ និងចំណារពន្យល់ BGC ។ហ្សែន GTDB ត្រូវ​បាន​អភិរក្ស​ដោយ​យោង​ទៅ​តាម​លក្ខណៈ​វិនិច្ឆ័យ​សុចរិតភាព​និង​ការ​ចម្លងរោគ​ខាងលើ។ការវិភាគរូបវិទ្យាត្រូវបានអនុវត្តដោយប្រើលំហូរការងារ Anvi'o Phylogenetics59 ។ដើមឈើនេះត្រូវបានសាងសង់ដោយប្រើ IQTREE (v.2.0.3) (ជម្រើសលំនាំដើម និង -bb 1000)80 លើការតម្រឹមនៃប្រូតេអ៊ីន 39 tandem ribosomal ដែលកំណត់ដោយ Anvi'o (MUSCLE, v.3.8.1551)81 ។មុខតំណែងរបស់គាត់ត្រូវបានកាត់បន្ថយ។ដើម្បីគ្របដណ្តប់យ៉ាងហោចណាស់ 50% នៃ genome82 និង Planctomycecota ត្រូវបានគេប្រើជាក្រុមក្រៅដោយផ្អែកលើ GTDB tree topology ។ដើមឈើមួយដើមនៃ 40 uscMGs ត្រូវបានសាងសង់ដោយប្រើឧបករណ៍ និងប៉ារ៉ាម៉ែត្រដូចគ្នា។
យើងបានប្រើ Traitar (v.1.1.2) ជាមួយនឹងប៉ារ៉ាម៉ែត្រលំនាំដើម (phenotype ពី nucleotides)83 ដើម្បីទស្សន៍ទាយលក្ខណៈអតិសុខុមប្រាណទូទៅ។យើងបានស្វែងរករបៀបរស់នៅដែលគួរឱ្យខ្លាចដោយផ្អែកលើសន្ទស្សន៍ 84 ដែលបានអភិវឌ្ឍពីមុន ដែលអាស្រ័យលើខ្លឹមសារនៃហ្សែនកូដប្រូតេអ៊ីននៅក្នុងហ្សែន។ជាពិសេស យើងប្រើ DIAMOND ដើម្បីប្រៀបធៀបប្រូតេអ៊ីននៅក្នុងហ្សែនប្រឆាំងនឹងមូលដ្ឋានទិន្នន័យ OrthoMCL (v.4)85 ដោយប្រើជម្រើស –more-sensive –id 25 –query-cover 70 –subject-cover 70 –top 20 ហើយរាប់ហ្សែនដែលត្រូវគ្នានឹង ហ្សែនសម្គាល់សម្រាប់សត្វមំសាសី និងអ្នកមិនបរបាញ់។លិបិក្រមគឺជាភាពខុសគ្នារវាងចំនួននៃសញ្ញា predatory និងមិន predatoryក្នុងនាមជាការត្រួតពិនិត្យបន្ថែម យើងក៏បានវិភាគហ្សែន "Ca" ផងដែរ។កត្តា Entotheonella TSY118 គឺផ្អែកលើការផ្សារភ្ជាប់របស់វាជាមួយ Ca ។Eudoremicrobium (ទំហំហ្សែនធំ និងសក្តានុពលជីវសំយោគ)។បន្ទាប់មកទៀត យើងបានសាកល្បងទំនាក់ទំនងសក្តានុពលរវាងហ្សែនសត្វមំសាសី និងហ្សែនដែលមិនមែនជាមំសាសី និងសក្តានុពលជីវសំយោគនៃ Ca ។Eudormicrobiaceae” ហើយបានរកឃើញថា ហ្សែនមិនលើសពីមួយ (ពីប្រភេទហ្សែនសម្គាល់ណាមួយ ពោលគឺហ្សែនសត្វមំសាសី/មិនមែនសត្វមច្ឆា) ត្រួតលើគ្នាជាមួយ BGC ដែលបង្ហាញថា BGC មិនច្រឡំសញ្ញានៃការចាប់រំលោភនោះទេ។ចំណារពន្យល់ហ្សែនបន្ថែមនៃអ្នកចម្លងដែលច្របូកច្របល់ត្រូវបានអនុវត្តដោយប្រើ TXSSCAN (v.1.0.2) ដើម្បីពិនិត្យជាពិសេសទៅលើប្រព័ន្ធសំងាត់ pili និង flagella86។
អ្នកតំណាង 'Ca's ចំនួន 5 នាក់ត្រូវបានគូសផែនទីដោយការគូសផែនទី 623 metatranscriptomes ពីប្រភាគ prokaryotic និង eukaryotic enrichment នៃមហាសមុទ្រ Tara 22,40,87 (ដោយប្រើ BWA, v.0.7.17-r1188, -a flag)។ហ្សែន Eudormicrobiaceae ។ឯកសារ BAM ត្រូវបានដំណើរការជាមួយ FeatureCounts (v.2.0.1)88 បន្ទាប់ពីអាន 80% និងការត្រងអត្តសញ្ញាណ 95% (ជាមួយជម្រើស featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p) រាប់ ចំនួននៃការបញ្ចូលក្នុងមួយហ្សែន។ផែនទីដែលបានបង្កើតត្រូវបានធ្វើឱ្យមានលក្ខណៈធម្មតាសម្រាប់ប្រវែងហ្សែន និងសញ្ញាសម្គាល់ហ្សែនច្រើនក្រៃលែង mOTU (ការរាប់បញ្ចូលជាមធ្យមប្រវែងធម្មតាសម្រាប់ហ្សែនដែលមានចំនួនសិលាចារឹក> 0) និងកំណត់ហេតុបានផ្លាស់ប្តូរទៅជា 22.74 ដើម្បីទទួលបានកន្សោមទាក់ទងក្នុងមួយកោសិកានៃកម្រិតហ្សែននីមួយៗ ដែលពន្យល់ផងដែរអំពី ភាពប្រែប្រួលពីគំរូទៅគំរូកំឡុងពេលបន្តបន្ទាប់គ្នា។សមាមាត្របែបនេះអនុញ្ញាតឱ្យមានការវិភាគប្រៀបធៀប កាត់បន្ថយបញ្ហាសមាសភាពនៅពេលប្រើទិន្នន័យសម្បូរទាក់ទង។មានតែសំណាកគំរូដែលមានហ្សែនសញ្ញាសម្គាល់ជាង 5 នៃ 10 mOTU ប៉ុណ្ណោះដែលត្រូវបានពិចារណាសម្រាប់ការវិភាគបន្ថែម ដើម្បីអនុញ្ញាតឱ្យរកឃើញផ្នែកធំគ្រប់គ្រាន់នៃហ្សែននេះ។
ទម្រង់ប្រតិចារឹកធម្មតានៃ 'Ca.E. taraoceanii ត្រូវបានទទួលរងនូវការកាត់បន្ថយវិមាត្រដោយប្រើ UMAP ហើយការតំណាងជាលទ្ធផលត្រូវបានប្រើសម្រាប់ការចង្កោមដែលមិនមានការត្រួតពិនិត្យដោយប្រើ HDBSCAN (សូមមើលខាងលើ) ដើម្បីកំណត់ស្ថានភាពកន្សោម។PERMANOVA សាកល្បងសារៈសំខាន់នៃភាពខុសគ្នារវាងចង្កោមដែលបានកំណត់នៅក្នុងចន្លោះចម្ងាយដើម (មិនកាត់បន្ថយ) ។កន្សោមឌីផេរ៉ង់ស្យែលរវាងលក្ខខណ្ឌទាំងនេះត្រូវបានធ្វើតេស្តឆ្លងកាត់ហ្សែន (សូមមើលខាងលើ) និងផ្លូវ KEGG ចំនួន 201 ត្រូវបានកំណត់ក្នុងក្រុមមុខងារចំនួន 6 គឺ៖ BGC ប្រព័ន្ធសំងាត់ និងហ្សែន flagellar ពី TXSSCAN អង់ស៊ីម degradation (protease និង peptidases) និង predatory និង non- ហ្សែន predatory ។សូចនាករសន្ទស្សន៍ predatory ។សម្រាប់គំរូនីមួយៗ យើងបានគណនាកន្សោមធម្មតាជាមធ្យមសម្រាប់ថ្នាក់នីមួយៗ (ចំណាំថាកន្សោម BGC ខ្លួនវាត្រូវបានគណនាជាកន្សោមមធ្យមនៃហ្សែនជីវសំយោគសម្រាប់ BGC នោះ) និងបានធ្វើតេស្តសម្រាប់សារៈសំខាន់នៅទូទាំងរដ្ឋ (ការធ្វើតេស្ត Kruskal-Wallis កែតម្រូវសម្រាប់ FDR) ។
ហ្សែនសំយោគត្រូវបានទិញពី GenScript ហើយថ្នាំ primers PCR ត្រូវបានទិញពី Microsynth ។Phusion polymerase ពី Thermo Fisher Scientific ត្រូវបានប្រើសម្រាប់ការពង្រីក DNA ។NucleoSpin plasmids, NucleoSpin gel និងឧបករណ៍បន្សុត PCR ពី Macherey-Nagel ត្រូវបានប្រើសម្រាប់ការបន្សុត DNA ។អង់ស៊ីមរឹតបន្តឹង និង T4 DNA ligase ត្រូវបានទិញពី New England Biolabs ។សារធាតុគីមីក្រៅពី isopropyl-β-d-1-thiogalactopyranoside (IPTG) (Biosynth) និង 1,4-dithiothreitol (DTT, AppliChem) ត្រូវបានទិញពី Sigma-Aldrich ហើយប្រើប្រាស់ដោយគ្មានការបន្សុតបន្ថែម។ថ្នាំអង់ទីប៊ីយោទិច chloramphenicol (Cm), spectinomycin dihydrochloride (Sm), ampicillin (Amp), gentamicin (Gt) និង carbenicillin (Cbn) ត្រូវបានទិញពី AppliChem ។សមាសធាតុប្រព័ន្ធផ្សព្វផ្សាយ Bacto Tryptone និង Bacto Yeast Extract ត្រូវបានទិញពី BD Biosciences ។Trypsin សម្រាប់​ធ្វើ​តាម​លំដាប់​ត្រូវ​បាន​ទិញ​ពី Promega ។
លំដាប់ហ្សែនត្រូវបានដកស្រង់ចេញពីការព្យាករណ៍ប្រឆាំងនឹង SMASH BGC 75.1 ។E. malaspinii (ពត៌មានបន្ថែម)។
ហ្សែន embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4) និង embAM (រាប់បញ្ចូលទាំងតំបន់អន្តរហ្សែន 5 និង UCR) ដែលមិនមានរចនាសម្ព័ន្ធដូចគ្នា codons ធ្វើឱ្យប្រសើរឡើងសម្រាប់ការបញ្ចេញមតិនៅក្នុង E ពេលណា​។ហ្សែន embA ត្រូវបានបញ្ចូលទៅក្នុងកន្លែងក្លូនច្រើនដំបូង (MCS1) នៃ pACYCDuet-1(CmR) និង pCDFDuet-1(SmR) ជាមួយនឹងកន្លែងបំបែក BamHI និង HindIII ។ហ្សែន embM និង embMopt (codon-optimized) ត្រូវបានបញ្ចូលទៅក្នុង MCS1 pCDFDuet-1(SmR) ជាមួយ BamHI និង HindIII ហើយដាក់នៅកន្លែងក្លូនច្រើនទីពីរនៃ pCDFDuet-1(SmR) និង pRSFDuet-1(KanR) (MCS2) ជាមួយ NdeI/ChoI ។កាសែត embAM ត្រូវបានបញ្ចូលទៅក្នុង pCDFDuet1(SmR) ជាមួយនឹងកន្លែងបំបែក BamHI និង HindIII ។ហ្សែន orf3/embI (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) ត្រូវបានសាងសង់ដោយផ្នែកបន្ថែមត្រួតលើគ្នា PCR ដោយប្រើ primers EmbI_OE_F_NdeI និង EmbI_OE_R_XhoI រំលាយជាមួយ NdeI/ated the pMCet1 re-MCD និង liguD ។ អង់ស៊ីមតឹងរ៉ឹង (បន្ថែម តារាង) ។៦).ការរឹតត្បិតការរំលាយអាហារ និងការភ្ជាប់អង់ស៊ីមត្រូវបានអនុវត្តតាមពិធីការរបស់អ្នកផលិត (New England Biolabs)។

 


ពេលវេលាផ្សាយ៖ ថ្ងៃទី ១៤ ខែមីនា ឆ្នាំ ២០២៣