304 ਸਟੇਨਲੈੱਸ ਸਟੀਲ ਵੇਲਡ ਕੋਇਲਡ ਟਿਊਬ/ਟਿਊਬਿੰਗ ਜ਼ੈਮੀਕਲ ਜ਼ੋਂਪੋਨੈਂਟ, ਗਲੋਬਲ ਮਰੀਨ ਮਾਈਕ੍ਰੋਬਾਇਓਮ ਦੀ ਬਾਇਓਸਿੰਥੈਟਿਕ ਸੰਭਾਵਨਾ

Nature.com 'ਤੇ ਜਾਣ ਲਈ ਤੁਹਾਡਾ ਧੰਨਵਾਦ।ਤੁਸੀਂ ਸੀਮਤ CSS ਸਮਰਥਨ ਦੇ ਨਾਲ ਇੱਕ ਬ੍ਰਾਊਜ਼ਰ ਸੰਸਕਰਣ ਵਰਤ ਰਹੇ ਹੋ।ਸਭ ਤੋਂ ਵਧੀਆ ਅਨੁਭਵ ਲਈ, ਅਸੀਂ ਸਿਫ਼ਾਰਿਸ਼ ਕਰਦੇ ਹਾਂ ਕਿ ਤੁਸੀਂ ਇੱਕ ਅੱਪਡੇਟ ਕੀਤੇ ਬ੍ਰਾਊਜ਼ਰ ਦੀ ਵਰਤੋਂ ਕਰੋ (ਜਾਂ ਇੰਟਰਨੈੱਟ ਐਕਸਪਲੋਰਰ ਵਿੱਚ ਅਨੁਕੂਲਤਾ ਮੋਡ ਨੂੰ ਅਯੋਗ ਕਰੋ)।ਇਸ ਤੋਂ ਇਲਾਵਾ, ਚੱਲ ਰਹੇ ਸਮਰਥਨ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ, ਅਸੀਂ ਸਟਾਈਲ ਅਤੇ JavaScript ਤੋਂ ਬਿਨਾਂ ਸਾਈਟ ਦਿਖਾਉਂਦੇ ਹਾਂ।
ਪ੍ਰਤੀ ਸਲਾਈਡ ਤਿੰਨ ਲੇਖ ਦਿਖਾਉਂਦੇ ਹੋਏ ਸਲਾਈਡਰ।ਸਲਾਈਡਾਂ ਵਿੱਚ ਜਾਣ ਲਈ ਪਿੱਛੇ ਅਤੇ ਅਗਲੇ ਬਟਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰੋ, ਜਾਂ ਹਰ ਇੱਕ ਸਲਾਈਡ ਵਿੱਚ ਜਾਣ ਲਈ ਅੰਤ ਵਿੱਚ ਸਲਾਈਡ ਕੰਟਰੋਲਰ ਬਟਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰੋ।

ਵਿਸਤ੍ਰਿਤ ਉਤਪਾਦ ਵੇਰਵਾ

304 ਸਟੇਨਲੈੱਸ ਸਟੀਲ ਵੇਲਡ ਕੋਇਲਡ ਟਿਊਬ/ਟਿਊਬਿੰਗ
1. ਨਿਰਧਾਰਨ: ਸਟੀਲ ਕੋਇਲ ਟਿਊਬ / ਟਿਊਬਿੰਗ
2. ਕਿਸਮ: welded ਜ ਸਹਿਜ
3. ਮਿਆਰੀ: ASTM A269, ASTM A249
4. ਸਟੀਲ ਕੋਇਲ ਟਿਊਬ OD: 6mm ਤੋਂ 25.4MM
5. ਲੰਬਾਈ: 600-3500MM ਜਾਂ ਗਾਹਕ ਦੀ ਲੋੜ ਅਨੁਸਾਰ.
6. ਕੰਧ ਮੋਟਾਈ: 0.2mm ਤੋਂ 2.0mm.

7. ਸਹਿਣਸ਼ੀਲਤਾ: OD: +/-0.01mm;ਮੋਟਾਈ: +/-0.01%।

8. ਕੋਇਲ ਅੰਦਰੂਨੀ ਮੋਰੀ ਦਾ ਆਕਾਰ: 500MM-1500MM (ਗਾਹਕ ਦੀਆਂ ਲੋੜਾਂ ਅਨੁਸਾਰ ਐਡਜਸਟ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ)

9. ਕੋਇਲ ਦੀ ਉਚਾਈ: 200MM-400MM (ਗਾਹਕ ਦੀਆਂ ਲੋੜਾਂ ਅਨੁਸਾਰ ਐਡਜਸਟ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ)

10. ਸਤਹ: ਚਮਕਦਾਰ ਜਾਂ ਐਨੀਲਡ
11. ਪਦਾਰਥ: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, ਮਿਸ਼ਰਤ 625, 825, 2205, 2507, ਆਦਿ।
12. ਪੈਕਿੰਗ: ਲੱਕੜ ਦੇ ਕੇਸ, ਲੱਕੜ ਦੇ ਪੈਲੇਟ, ਲੱਕੜ ਦੇ ਸ਼ਾਫਟ, ਜਾਂ ਗਾਹਕ ਦੀ ਲੋੜ ਅਨੁਸਾਰ ਬੁਣੇ ਹੋਏ ਬੈਗ
13. ਟੈਸਟ: ਰਸਾਇਣਕ ਭਾਗ, ਉਪਜ ਦੀ ਤਾਕਤ, ਤਣਾਅ ਦੀ ਤਾਕਤ, ਕਠੋਰਤਾ ਮਾਪ
14. ਗਾਰੰਟੀ: ਤੀਜੀ ਧਿਰ (ਉਦਾਹਰਨ ਲਈ: SGS TV) ਨਿਰੀਖਣ, ਆਦਿ।
15. ਐਪਲੀਕੇਸ਼ਨ: ਸਜਾਵਟ, ਫਰਨੀਚਰ, ਤੇਲ ਦੀ ਆਵਾਜਾਈ, ਹੀਟ ​​ਐਕਸਚੇਂਜਰ, ਰੇਲਿੰਗ ਬਣਾਉਣਾ, ਕਾਗਜ਼ ਬਣਾਉਣਾ, ਆਟੋਮੋਬਾਈਲ, ਫੂਡ ਪ੍ਰੋਸੈਸਿੰਗ, ਮੈਡੀਕਲ, ਆਦਿ।

ਸਟੇਨਲੈੱਸ ਸਟੀਲ ਲਈ ਸਾਰੀਆਂ ਰਸਾਇਣਕ ਰਚਨਾਵਾਂ ਅਤੇ ਭੌਤਿਕ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਜਿਵੇਂ ਕਿ:

ਸਮੱਗਰੀ ASTM A269 ਰਸਾਇਣਕ ਰਚਨਾ % ਅਧਿਕਤਮ
C Mn P S Si Cr Ni Mo NB Nb Ti
TP304 0.08 2.00 0.045 0.030 1.00 18.0-20.0 8.0-11.0 ^ ^ ^ ^
TP304L 0.035 2.00 0.045 0.030 1.00 18.0-20.0 8.0-12.0 ^ ^ ^ ^
TP316 0.08 2.00 0.045 0.030 1.00 16.0-18.0 10.0-14.0 2.00-3.00 ^ ^ ^
TP316L 0.035 ਡੀ 2.00 0.045 0.030 1.00 16.0-18.0 10.0-15.0 2.00-3.00 ^ ^ ^
TP321 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 ^ ^ ^ 5C -0.70
TP347 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 10C -1.10 ^

 

ਸਮੱਗਰੀ ਗਰਮੀ ਦਾ ਇਲਾਜ ਤਾਪਮਾਨ F (C) ਘੱਟੋ-ਘੱਟ ਕਠੋਰਤਾ
ਬ੍ਰਿਨਲ ਰੌਕਵੈਲ
TP304 ਦਾ ਹੱਲ 1900 (1040) 192HBW/200HV 90HRB
TP304L ਦਾ ਹੱਲ 1900 (1040) 192HBW/200HV 90HRB
TP316 ਦਾ ਹੱਲ 1900 (1040) 192HBW/200HV 90HRB
TP316L ਦਾ ਹੱਲ 1900 (1040) 192HBW/200HV 90HRB
TP321 ਦਾ ਹੱਲ 1900 (1040) ਐੱਫ 192HBW/200HV 90HRB
TP347 ਦਾ ਹੱਲ 1900 (1040) 192HBW/200HV 90HRB

 

OD, ਇੰਚ OD ਸਹਿਣਸ਼ੀਲਤਾ ਇੰਚ(mm) WT ਸਹਿਣਸ਼ੀਲਤਾ % ਲੰਬਾਈ ਸਹਿਣਸ਼ੀਲਤਾ ਇੰਚ(ਮਿਲੀਮੀਟਰ)
+ -
≤ 1 / 2 ± 0.005 ( 0.13 ) ± 15 1 / 8 ( 3.2 ) 0
> 1 / 2 ~ 1 1 / 2 ± 0.005(0.13) ± 10 1 / 8 (3.2) 0
> 1 1 / 2 ~< 3 1 / 2 ± 0.010(0.25) ± 10 3 / 16 (4.8) 0
> 3 1 / 2 ~< 5 1 / 2 ± 0.015(0.38) ± 10 3 / 16 (4.8) 0
> 5 1 / 2 ~< 8 ± 0.030(0.76) ± 10 3 / 16 (4.8) 0
8~< 12 ± 0.040(1.01) ± 10 3 / 16 (4.8) 0
12~< 14 ± 0.050(1.26) ± 10 3 / 16 (4.8) 0

ਕੁਦਰਤੀ ਮਾਈਕ੍ਰੋਬਾਇਲ ਕਮਿਊਨਿਟੀਆਂ ਫਾਈਲੋਜੈਨੇਟਿਕ ਅਤੇ ਪਾਚਕ ਤੌਰ 'ਤੇ ਵਿਭਿੰਨ ਹਨ।ਜੀਵ-ਜੰਤੂਆਂ ਦੇ ਸਮਝੇ ਗਏ ਸਮੂਹਾਂ ਤੋਂ ਇਲਾਵਾ, ਇਹ ਵਿਭਿੰਨਤਾ ਵਾਤਾਵਰਣ ਅਤੇ ਬਾਇਓਟੈਕਨਾਲੋਜੀ ਤੌਰ 'ਤੇ ਮਹੱਤਵਪੂਰਨ ਐਨਜ਼ਾਈਮਾਂ ਅਤੇ ਬਾਇਓਕੈਮੀਕਲ ਮਿਸ਼ਰਣਾਂ 2,3 ਦੀ ਖੋਜ ਲਈ ਵੀ ਭਰਪੂਰ ਸੰਭਾਵਨਾ ਰੱਖਦੀ ਹੈ।ਹਾਲਾਂਕਿ, ਜੀਨੋਮਿਕ ਮਾਰਗਾਂ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰਨ ਲਈ ਇਸ ਵਿਭਿੰਨਤਾ ਦਾ ਅਧਿਐਨ ਕਰਨਾ ਜੋ ਅਜਿਹੇ ਮਿਸ਼ਰਣਾਂ ਨੂੰ ਸੰਸਲੇਸ਼ਣ ਕਰਦੇ ਹਨ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਉਹਨਾਂ ਦੇ ਸੰਬੰਧਿਤ ਮੇਜ਼ਬਾਨਾਂ ਨਾਲ ਜੋੜਦੇ ਹਨ, ਇੱਕ ਚੁਣੌਤੀ ਬਣੀ ਹੋਈ ਹੈ।ਗਲੋਬਲ ਪੈਮਾਨੇ 'ਤੇ ਪੂਰੇ ਜੀਨੋਮ ਰੈਜ਼ੋਲਿਊਸ਼ਨ ਡੇਟਾ ਦੇ ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਸੀਮਾਵਾਂ ਦੇ ਕਾਰਨ ਖੁੱਲੇ ਸਮੁੰਦਰ ਵਿੱਚ ਸੂਖਮ ਜੀਵਾਂ ਦੀ ਬਾਇਓਸਿੰਥੈਟਿਕ ਸੰਭਾਵਨਾ ਕਾਫ਼ੀ ਹੱਦ ਤੱਕ ਅਣਜਾਣ ਹੈ।ਇੱਥੇ, ਅਸੀਂ 1,000 ਤੋਂ ਵੱਧ ਸਮੁੰਦਰੀ ਪਾਣੀ ਦੇ ਨਮੂਨਿਆਂ ਤੋਂ 25,000 ਤੋਂ ਵੱਧ ਨਵੇਂ ਪੁਨਰਗਠਿਤ ਡਰਾਫਟ ਜੀਨੋਮ ਦੇ ਨਾਲ ਸੰਸਕ੍ਰਿਤ ਸੈੱਲਾਂ ਅਤੇ ਸਿੰਗਲ ਸੈੱਲਾਂ ਤੋਂ ਲਗਭਗ 10,000 ਮਾਈਕ੍ਰੋਬਾਇਲ ਜੀਨੋਮ ਨੂੰ ਏਕੀਕ੍ਰਿਤ ਕਰਕੇ ਸਮੁੰਦਰ ਵਿੱਚ ਬਾਇਓਸਿੰਥੈਟਿਕ ਜੀਨ ਕਲੱਸਟਰਾਂ ਦੀ ਵਿਭਿੰਨਤਾ ਅਤੇ ਵਿਭਿੰਨਤਾ ਦੀ ਪੜਚੋਲ ਕਰਦੇ ਹਾਂ।ਇਹਨਾਂ ਯਤਨਾਂ ਨੇ ਲਗਭਗ 40,000 ਪੁਟੇਟਿਵ ਜਿਆਦਾਤਰ ਨਵੇਂ ਬਾਇਓਸਿੰਥੈਟਿਕ ਜੀਨ ਕਲੱਸਟਰਾਂ ਦੀ ਪਛਾਣ ਕੀਤੀ ਹੈ, ਜਿਨ੍ਹਾਂ ਵਿੱਚੋਂ ਕੁਝ ਪਹਿਲਾਂ ਅਣਪਛਾਤੇ ਫਾਈਲੋਜੈਨੇਟਿਕ ਸਮੂਹਾਂ ਵਿੱਚ ਪਾਏ ਗਏ ਹਨ।ਇਹਨਾਂ ਆਬਾਦੀਆਂ ਵਿੱਚ, ਅਸੀਂ ਬਾਇਓਸਿੰਥੈਟਿਕ ਜੀਨ ਕਲੱਸਟਰਾਂ ("ਕੈਂਡੀਡੇਟਸ ਯੂਡੋਰਮਾਈਕਰੋਬਿਆਸੀ") ਵਿੱਚ ਭਰਪੂਰ ਇੱਕ ਵੰਸ਼ ਦੀ ਪਛਾਣ ਕੀਤੀ ਹੈ ਜੋ ਕਿ ਇੱਕ ਗੈਰ-ਖੇਤੀ ਬੈਕਟੀਰੀਅਲ ਫਾਈਲਮ ਨਾਲ ਸਬੰਧਤ ਸੀ ਅਤੇ ਇਸ ਵਾਤਾਵਰਣ ਵਿੱਚ ਕੁਝ ਸਭ ਤੋਂ ਵੱਧ ਬਾਇਓਸਿੰਥੈਟਿਕ ਤੌਰ 'ਤੇ ਵਿਭਿੰਨ ਸੂਖਮ ਜੀਵ ਸ਼ਾਮਲ ਸਨ।ਇਹਨਾਂ ਵਿੱਚੋਂ, ਅਸੀਂ ਕ੍ਰਮਵਾਰ ਅਸਧਾਰਨ ਬਾਇਓਐਕਟਿਵ ਮਿਸ਼ਰਣ ਬਣਤਰ ਅਤੇ ਐਨਜ਼ਾਈਮੋਲੋਜੀ ਦੀਆਂ ਉਦਾਹਰਣਾਂ ਦੀ ਪਛਾਣ ਕਰਦੇ ਹੋਏ, ਫਾਸਫੇਟੇਜ਼-ਪੇਪਟਾਇਡ ਅਤੇ ਪਾਈਟੋਨਾਮਾਈਡ ਮਾਰਗਾਂ ਦੀ ਵਿਸ਼ੇਸ਼ਤਾ ਕੀਤੀ ਹੈ।ਸਿੱਟੇ ਵਜੋਂ, ਇਹ ਅਧਿਐਨ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਕਿਵੇਂ ਮਾਈਕਰੋਬਾਇਓਮ-ਅਧਾਰਿਤ ਰਣਨੀਤੀਆਂ ਮਾੜੀ ਸਮਝੇ ਗਏ ਮਾਈਕ੍ਰੋਬਾਇਓਟਾ ਅਤੇ ਵਾਤਾਵਰਣ ਵਿੱਚ ਪਹਿਲਾਂ ਨਾ ਦੱਸੇ ਗਏ ਐਨਜ਼ਾਈਮਾਂ ਅਤੇ ਕੁਦਰਤੀ ਭੋਜਨਾਂ ਦੀ ਖੋਜ ਨੂੰ ਸਮਰੱਥ ਬਣਾ ਸਕਦੀਆਂ ਹਨ।
ਜੀਵਾਣੂ ਗਲੋਬਲ ਬਾਇਓਜੀਓਕੈਮੀਕਲ ਚੱਕਰ ਚਲਾਉਂਦੇ ਹਨ, ਭੋਜਨ ਦੇ ਜਾਲਾਂ ਨੂੰ ਬਣਾਈ ਰੱਖਦੇ ਹਨ, ਅਤੇ ਪੌਦਿਆਂ ਅਤੇ ਜਾਨਵਰਾਂ ਨੂੰ ਸਿਹਤਮੰਦ ਰੱਖਦੇ ਹਨ5।ਉਹਨਾਂ ਦੀ ਵਿਸ਼ਾਲ ਫਾਈਲੋਜੈਨੇਟਿਕ, ਪਾਚਕ ਅਤੇ ਕਾਰਜਸ਼ੀਲ ਵਿਭਿੰਨਤਾ ਕੁਦਰਤੀ ਉਤਪਾਦਾਂ ਸਮੇਤ ਨਵੇਂ ਟੈਕਸਾ1, ਪਾਚਕ ਅਤੇ ਬਾਇਓਕੈਮੀਕਲ ਮਿਸ਼ਰਣਾਂ ਦੀ ਖੋਜ ਲਈ ਇੱਕ ਅਮੀਰ ਸੰਭਾਵਨਾ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ।ਵਾਤਾਵਰਣਕ ਭਾਈਚਾਰਿਆਂ ਵਿੱਚ, ਇਹ ਅਣੂ ਸੂਖਮ ਜੀਵਾਣੂਆਂ ਨੂੰ ਕਈ ਤਰ੍ਹਾਂ ਦੇ ਸਰੀਰਕ ਅਤੇ ਵਾਤਾਵਰਣ ਸੰਬੰਧੀ ਕਾਰਜ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ, ਸੰਚਾਰ ਤੋਂ ਮੁਕਾਬਲੇ ਤੱਕ 2, 7।ਉਹਨਾਂ ਦੇ ਅਸਲ ਕਾਰਜਾਂ ਤੋਂ ਇਲਾਵਾ, ਇਹ ਕੁਦਰਤੀ ਉਤਪਾਦ ਅਤੇ ਉਹਨਾਂ ਦੇ ਜੈਨੇਟਿਕ ਤੌਰ 'ਤੇ ਕੋਡ ਕੀਤੇ ਉਤਪਾਦਨ ਮਾਰਗ ਬਾਇਓਟੈਕਨਾਲੌਜੀ ਅਤੇ ਇਲਾਜ ਸੰਬੰਧੀ ਐਪਲੀਕੇਸ਼ਨਾਂ 2,3 ਲਈ ਉਦਾਹਰਣ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ।ਸੰਸਕ੍ਰਿਤ ਰੋਗਾਣੂਆਂ ਦੇ ਅਧਿਐਨ ਦੁਆਰਾ ਅਜਿਹੇ ਮਾਰਗਾਂ ਅਤੇ ਕਨੈਕਸ਼ਨਾਂ ਦੀ ਪਛਾਣ ਕਰਨ ਵਿੱਚ ਬਹੁਤ ਮਦਦ ਕੀਤੀ ਗਈ ਹੈ।ਹਾਲਾਂਕਿ, ਕੁਦਰਤੀ ਵਾਤਾਵਰਣਾਂ ਦੇ ਵਰਗੀਕਰਨ ਅਧਿਐਨਾਂ ਨੇ ਦਿਖਾਇਆ ਹੈ ਕਿ ਬਹੁਤ ਸਾਰੇ ਸੂਖਮ ਜੀਵਾਂ ਦੀ ਕਾਸ਼ਤ ਨਹੀਂ ਕੀਤੀ ਗਈ ਹੈ।ਇਹ ਸੱਭਿਆਚਾਰਕ ਪੱਖਪਾਤ ਬਹੁਤ ਸਾਰੇ ਰੋਗਾਣੂ 4,9 ਦੁਆਰਾ ਏਨਕੋਡ ਕੀਤੀ ਕਾਰਜਸ਼ੀਲ ਵਿਭਿੰਨਤਾ ਦਾ ਸ਼ੋਸ਼ਣ ਕਰਨ ਦੀ ਸਾਡੀ ਯੋਗਤਾ ਨੂੰ ਸੀਮਤ ਕਰਦਾ ਹੈ।
ਇਹਨਾਂ ਸੀਮਾਵਾਂ ਨੂੰ ਦੂਰ ਕਰਨ ਲਈ, ਪਿਛਲੇ ਦਹਾਕੇ ਵਿੱਚ ਤਕਨੀਕੀ ਤਰੱਕੀ ਨੇ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਸਮੁੱਚੇ ਭਾਈਚਾਰਿਆਂ (ਮੈਟਾਜੇਨੋਮਿਕਸ) ਜਾਂ ਸਿੰਗਲ ਸੈੱਲਾਂ ਤੋਂ ਸਿੱਧੇ ਤੌਰ 'ਤੇ (ਭਾਵ, ਪੁਰਾਣੇ ਸੰਸਕ੍ਰਿਤੀ ਤੋਂ ਬਿਨਾਂ) ਮਾਈਕ੍ਰੋਬਾਇਲ ਡੀਐਨਏ ਦੇ ਟੁਕੜਿਆਂ ਨੂੰ ਕ੍ਰਮਬੱਧ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੱਤੀ ਹੈ।ਇਹਨਾਂ ਟੁਕੜਿਆਂ ਨੂੰ ਵੱਡੇ ਜੀਨੋਮ ਦੇ ਟੁਕੜਿਆਂ ਵਿੱਚ ਇਕੱਠਾ ਕਰਨ ਅਤੇ ਕ੍ਰਮਵਾਰ ਮਲਟੀਪਲ ਮੈਟਾਜੇਨੋਮਿਕਲੀ ਅਸੈਂਬਲਡ ਜੀਨੋਮ (MAGs) ਜਾਂ ਸਿੰਗਲ ਐਂਪਲੀਫਾਈਡ ਜੀਨੋਮ (SAGs) ਦਾ ਪੁਨਰਗਠਨ ਕਰਨ ਦੀ ਯੋਗਤਾ, ਮਾਈਕ੍ਰੋਬਾਇਓਮ (ਭਾਵ, ਮਾਈਕ੍ਰੋਬਾਇਲ ਕਮਿਊਨਿਟੀਜ਼ ਅਤੇ ਮਾਈਕ੍ਰੋਬਾਇਓਮ) ਦੇ ਟੈਕਸੋਸੈਂਟ੍ਰਿਕ ਅਧਿਐਨ ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਮੌਕਾ ਖੋਲ੍ਹਦੀ ਹੈ।ਨਵੇਂ ਰਸਤੇ ਤਿਆਰ ਕਰੋ।ਇੱਕ ਦਿੱਤੇ ਵਾਤਾਵਰਣ ਵਿੱਚ ਆਪਣੀ ਜੈਨੇਟਿਕ ਸਮੱਗਰੀ) 10,11,12.ਦਰਅਸਲ, ਹਾਲ ਹੀ ਦੇ ਅਧਿਐਨਾਂ ਨੇ ਧਰਤੀ 1, 13 'ਤੇ ਮਾਈਕਰੋਬਾਇਲ ਵਿਭਿੰਨਤਾ ਦੀ ਫਾਈਲੋਜੈਨੀਟਿਕ ਪ੍ਰਤੀਨਿਧਤਾ ਦਾ ਬਹੁਤ ਵਿਸਤਾਰ ਕੀਤਾ ਹੈ ਅਤੇ ਵਿਅਕਤੀਗਤ ਮਾਈਕ੍ਰੋਬਾਇਲ ਕਮਿਊਨਿਟੀਆਂ ਵਿੱਚ ਬਹੁਤ ਜ਼ਿਆਦਾ ਕਾਰਜਸ਼ੀਲ ਵਿਭਿੰਨਤਾ ਨੂੰ ਪ੍ਰਗਟ ਕੀਤਾ ਹੈ ਜੋ ਪਹਿਲਾਂ ਸੰਸਕ੍ਰਿਤ ਸੂਖਮ ਜੀਵ ਸੰਦਰਭ ਜੀਨੋਮ ਕ੍ਰਮ (REFs) 14 ਦੁਆਰਾ ਕਵਰ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਸੀ।ਹੋਸਟ ਜੀਨੋਮ (ਭਾਵ, ਜੀਨੋਮ ਰੈਜ਼ੋਲਿਊਸ਼ਨ) ਦੇ ਸੰਦਰਭ ਵਿੱਚ ਅਣਡਿੱਠੀ ਕਾਰਜਸ਼ੀਲ ਵਿਭਿੰਨਤਾ ਨੂੰ ਰੱਖਣ ਦੀ ਯੋਗਤਾ ਅਜੇ ਤੱਕ ਅਣ-ਪਛਾਣੀਆਂ ਮਾਈਕਰੋਬਾਇਲ ਲਾਈਨਾਂ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ ਜੋ ਸੰਭਾਵਤ ਤੌਰ 'ਤੇ ਨਵੇਂ ਕੁਦਰਤੀ ਉਤਪਾਦਾਂ15,16 ਨੂੰ ਏਨਕੋਡ ਕਰਦੀਆਂ ਹਨ ਜਾਂ ਅਜਿਹੇ ਮਿਸ਼ਰਣਾਂ ਨੂੰ ਉਹਨਾਂ ਦੇ ਅਸਲ ਉਤਪਾਦਕ 17 ਤੱਕ ਟਰੇਸ ਕਰਨ ਲਈ।ਉਦਾਹਰਨ ਲਈ, ਇੱਕ ਸੰਯੁਕਤ ਮੈਟਾਜੇਨੋਮਿਕ ਅਤੇ ਸਿੰਗਲ-ਸੈੱਲ ਜੀਨੋਮਿਕ ਵਿਸ਼ਲੇਸ਼ਣ ਪਹੁੰਚ ਨੇ ਕੈਡੀਡੇਟਸ ਐਂਟੋਥੀਓਨੇਲਾ ਦੀ ਪਛਾਣ ਕੀਤੀ ਹੈ, ਮੈਟਾਬੋਲੀਕ ਤੌਰ 'ਤੇ ਅਮੀਰ ਸਪੰਜ-ਸਬੰਧਤ ਬੈਕਟੀਰੀਆ ਦਾ ਇੱਕ ਸਮੂਹ, ਕਈ ਤਰ੍ਹਾਂ ਦੀਆਂ ਦਵਾਈਆਂ ਦੀਆਂ ਸੰਭਾਵਨਾਵਾਂ ਦੇ ਉਤਪਾਦਕਾਂ ਵਜੋਂ 18।ਹਾਲਾਂਕਿ, ਵਿਭਿੰਨ ਮਾਈਕ੍ਰੋਬਾਇਲ ਕਮਿਊਨਿਟੀਆਂ ਦੇ ਜੀਨੋਮਿਕ ਖੋਜ ਦੇ ਹਾਲ ਹੀ ਦੇ ਯਤਨਾਂ ਦੇ ਬਾਵਜੂਦ, 16,19 ਈਕੋਸਿਸਟਮ ਦੇ ਧਰਤੀ ਦੇ ਸਭ ਤੋਂ ਵੱਡੇ ਸਮੁੰਦਰ ਲਈ ਗਲੋਬਲ ਮੈਟਾਜੇਨੋਮਿਕ ਡੇਟਾ ਦੇ ਦੋ ਤਿਹਾਈ ਤੋਂ ਵੱਧ 16,20 ਅਜੇ ਵੀ ਗਾਇਬ ਹਨ।ਇਸ ਤਰ੍ਹਾਂ, ਆਮ ਤੌਰ 'ਤੇ, ਸਮੁੰਦਰੀ ਮਾਈਕ੍ਰੋਬਾਇਓਮ ਦੀ ਬਾਇਓਸਿੰਥੈਟਿਕ ਸੰਭਾਵੀ ਅਤੇ ਨਾਵਲ ਐਨਜ਼ਾਈਮੈਟਿਕ ਅਤੇ ਕੁਦਰਤੀ ਉਤਪਾਦਾਂ ਦੇ ਭੰਡਾਰ ਵਜੋਂ ਇਸਦੀ ਸੰਭਾਵਨਾ ਨੂੰ ਵੱਡੇ ਪੱਧਰ 'ਤੇ ਸਮਝਿਆ ਨਹੀਂ ਜਾਂਦਾ ਹੈ।
ਗਲੋਬਲ ਪੈਮਾਨੇ 'ਤੇ ਸਮੁੰਦਰੀ ਮਾਈਕ੍ਰੋਬਾਇਓਮਜ਼ ਦੀ ਬਾਇਓਸਿੰਥੈਟਿਕ ਸੰਭਾਵਨਾ ਦੀ ਪੜਚੋਲ ਕਰਨ ਲਈ, ਅਸੀਂ ਸਭ ਤੋਂ ਪਹਿਲਾਂ ਫਾਈਲੋਜੈਨੇਟਿਕਸ ਅਤੇ ਜੀਨ ਫੰਕਸ਼ਨ ਦਾ ਇੱਕ ਵਿਆਪਕ ਡੇਟਾਬੇਸ ਬਣਾਉਣ ਲਈ ਸੱਭਿਆਚਾਰ-ਨਿਰਭਰ ਅਤੇ ਗੈਰ-ਸਭਿਆਚਾਰ ਵਿਧੀਆਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਪ੍ਰਾਪਤ ਕੀਤੇ ਸਮੁੰਦਰੀ ਮਾਈਕ੍ਰੋਬਾਇਲ ਜੀਨੋਮਜ਼ ਨੂੰ ਪੂਲ ਕੀਤਾ।ਇਸ ਡੇਟਾਬੇਸ ਦੀ ਜਾਂਚ ਤੋਂ ਬਾਇਓਸਿੰਥੈਟਿਕ ਜੀਨ ਕਲੱਸਟਰ (BGCs) ਦੀ ਇੱਕ ਵਿਭਿੰਨ ਕਿਸਮ ਦਾ ਖੁਲਾਸਾ ਹੋਇਆ ਹੈ, ਜਿਨ੍ਹਾਂ ਵਿੱਚੋਂ ਜ਼ਿਆਦਾਤਰ ਅਜੇ ਤੱਕ ਅਣਪਛਾਤੇ ਜੀਨ ਕਲੱਸਟਰ (GCF) ਪਰਿਵਾਰਾਂ ਨਾਲ ਸਬੰਧਤ ਹਨ।ਇਸ ਤੋਂ ਇਲਾਵਾ, ਅਸੀਂ ਇੱਕ ਅਣਜਾਣ ਬੈਕਟੀਰੀਆ ਪਰਿਵਾਰ ਦੀ ਪਛਾਣ ਕੀਤੀ ਹੈ ਜੋ ਅੱਜ ਤੱਕ ਖੁੱਲੇ ਸਮੁੰਦਰ ਵਿੱਚ BGCs ਦੀ ਸਭ ਤੋਂ ਵੱਧ ਜਾਣੀ ਜਾਂਦੀ ਵਿਭਿੰਨਤਾ ਨੂੰ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਦਾ ਹੈ।ਅਸੀਂ ਵਰਤਮਾਨ ਵਿੱਚ ਜਾਣੇ-ਪਛਾਣੇ ਮਾਰਗਾਂ ਤੋਂ ਉਹਨਾਂ ਦੇ ਜੈਨੇਟਿਕ ਅੰਤਰਾਂ ਦੇ ਅਧਾਰ ਤੇ ਪ੍ਰਯੋਗਾਤਮਕ ਪ੍ਰਮਾਣਿਕਤਾ ਲਈ ਦੋ ਰਿਬੋਸੋਮਲ ਸੰਸਲੇਸ਼ਣ ਅਤੇ ਪੋਸਟ-ਅਨੁਵਾਦਿਕ ਤੌਰ 'ਤੇ ਸੋਧੇ ਹੋਏ ਪੇਪਟਾਇਡ (RiPP) ਮਾਰਗਾਂ ਦੀ ਚੋਣ ਕੀਤੀ ਹੈ।ਇਹਨਾਂ ਮਾਰਗਾਂ ਦੀ ਕਾਰਜਸ਼ੀਲ ਵਿਸ਼ੇਸ਼ਤਾ ਨੇ ਐਨਜ਼ਾਈਮੋਲੋਜੀ ਦੀਆਂ ਅਣਕਿਆਸੀ ਉਦਾਹਰਣਾਂ ਦੇ ਨਾਲ-ਨਾਲ ਪ੍ਰੋਟੀਜ਼ ਇਨ੍ਹੀਬੀਟਰੀ ਗਤੀਵਿਧੀ ਦੇ ਨਾਲ ਢਾਂਚਾਗਤ ਤੌਰ 'ਤੇ ਅਸਧਾਰਨ ਮਿਸ਼ਰਣਾਂ ਦਾ ਖੁਲਾਸਾ ਕੀਤਾ ਹੈ।
ਪਹਿਲਾਂ, ਅਸੀਂ ਜੀਨੋਮ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਇੱਕ ਗਲੋਬਲ ਡੇਟਾ ਸਰੋਤ ਬਣਾਉਣ ਦਾ ਟੀਚਾ ਰੱਖਿਆ, ਇਸਦੇ ਬੈਕਟੀਰੀਆ ਅਤੇ ਪੁਰਾਤੱਤਵ ਭਾਗਾਂ 'ਤੇ ਕੇਂਦ੍ਰਤ ਕਰਦੇ ਹੋਏ।ਇਸ ਲਈ, ਅਸੀਂ 215 ਵਿਸ਼ਵ ਪੱਧਰ 'ਤੇ ਵੰਡੀਆਂ ਗਈਆਂ ਨਮੂਨਾ ਸਾਈਟਾਂ (ਅਕਸ਼ਾਂਸ਼ ਰੇਂਜ = 141.6°) ਅਤੇ ਕਈ ਡੂੰਘੀਆਂ ਪਰਤਾਂ (1 ਤੋਂ 5600 ਮੀਟਰ ਦੀ ਡੂੰਘਾਈ ਤੱਕ, ਪੈਲੇਜਿਕ, ਮੇਸੋਪੈਲੇਜਿਕ ਅਤੇ ਅਬੀਸਲ ਜ਼ੋਨ ਨੂੰ ਕਵਰ ਕਰਦੇ ਹੋਏ) ਤੋਂ ਮੈਟਾਜੇਨੋਮਿਕ ਡੇਟਾ ਅਤੇ 1038 ਸਮੁੰਦਰੀ ਪਾਣੀ ਦੇ ਨਮੂਨੇ ਇਕੱਠੇ ਕੀਤੇ।ਪਿਛੋਕੜ21,22,23 (ਚਿੱਤਰ 1a, ਵਿਸਤ੍ਰਿਤ ਡੇਟਾ, ਚਿੱਤਰ 1a ਅਤੇ ਪੂਰਕ ਸਾਰਣੀ 1)।ਇੱਕ ਵਿਆਪਕ ਭੂਗੋਲਿਕ ਕਵਰੇਜ ਪ੍ਰਦਾਨ ਕਰਨ ਤੋਂ ਇਲਾਵਾ, ਇਹਨਾਂ ਚੋਣਵੇਂ ਤੌਰ 'ਤੇ ਫਿਲਟਰ ਕੀਤੇ ਨਮੂਨਿਆਂ ਨੇ ਸਾਨੂੰ ਸਮੁੰਦਰੀ ਮਾਈਕ੍ਰੋਬਾਇਓਮ ਦੇ ਵੱਖ-ਵੱਖ ਹਿੱਸਿਆਂ ਦੀ ਤੁਲਨਾ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੱਤੀ, ਜਿਸ ਵਿੱਚ ਵਾਇਰਸ-ਅਮੀਰ (<0.2 µm), ਪ੍ਰੋਕੈਰੀਓਟਿਕ-ਅਮੀਰ (0.2–3 µm), ਕਣ-ਅਮੀਰ (0.8 µm) ਸ਼ਾਮਲ ਹਨ। ).-20 µm) ਅਤੇ ਵਾਇਰਸ-ਡੈਪਲੀਟਿਡ (>0.2 µm) ਕਲੋਨੀਆਂ।
a, ਕੁੱਲ 1038 ਜਨਤਕ ਤੌਰ 'ਤੇ ਉਪਲਬਧ ਜੀਨੋਮਜ਼ (ਮੈਟਾਜੇਨੋਮਿਕਸ) ਸਮੁੰਦਰੀ ਮਾਈਕ੍ਰੋਬਾਇਲ ਕਮਿਊਨਿਟੀਆਂ ਦੇ 215 ਵਿਸ਼ਵ ਪੱਧਰ 'ਤੇ ਵੰਡੇ ਗਏ ਸਥਾਨਾਂ (62°S ਤੋਂ 79°N ਅਤੇ 179°W ਤੋਂ 179°E ਤੱਕ ਇਕੱਠੇ ਕੀਤੇ ਗਏ ਹਨ।)।ਨਕਸ਼ਾ ਟਾਇਲਸ © Esri.ਸਰੋਤ: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ, ਅਤੇ Esri।b, ਇਹਨਾਂ ਮੈਟਾਜੇਨੋਮ ਦੀ ਵਰਤੋਂ MAGs (ਤਰੀਕਿਆਂ ਅਤੇ ਵਾਧੂ ਜਾਣਕਾਰੀ) ਨੂੰ ਪੁਨਰਗਠਨ ਕਰਨ ਲਈ ਕੀਤੀ ਗਈ ਸੀ, ਜੋ ਕਿ ਡੇਟਾਸੈਟਾਂ (ਰੰਗ ਵਿੱਚ ਚਿੰਨ੍ਹਿਤ) ਵਿੱਚ ਮਾਤਰਾ ਅਤੇ ਗੁਣਵੱਤਾ (ਤਰੀਕਿਆਂ) ਵਿੱਚ ਭਿੰਨ ਹਨ।ਪੁਨਰਗਠਿਤ MAGs ਨੂੰ ਜਨਤਕ ਤੌਰ 'ਤੇ ਉਪਲਬਧ (ਬਾਹਰੀ) ਜੀਨੋਮ ਨਾਲ ਪੂਰਕ ਕੀਤਾ ਗਿਆ ਸੀ, ਜਿਸ ਵਿੱਚ ਹੈਂਡਕ੍ਰਾਫਟਡ MAG26, SAG27 ਅਤੇ REF ਸ਼ਾਮਲ ਹਨ।27 OMD ਕੰਪਾਇਲ ਕਰੋ।c, ਸਿਰਫ਼ SAG (GORG)20 ਜਾਂ MAG (GEM)16 'ਤੇ ਆਧਾਰਿਤ ਪਿਛਲੀਆਂ ਰਿਪੋਰਟਾਂ ਦੀ ਤੁਲਨਾ ਵਿੱਚ, OMD ਡੂੰਘਾਈ ਵਿੱਚ ਵਧੇਰੇ ਨਿਰੰਤਰ ਨੁਮਾਇੰਦਗੀ ਦੇ ਨਾਲ ਸਮੁੰਦਰੀ ਮਾਈਕ੍ਰੋਬਾਇਲ ਕਮਿਊਨਿਟੀਆਂ (ਮੈਟਾਜੇਨੋਮਿਕ ਰੀਡ ਮੈਪਿੰਗ ਰੇਟ; ਵਿਧੀ) ਦੇ ਜੀਨੋਮਿਕ ਗੁਣਾਂ ਨੂੰ ਦੋ ਤੋਂ ਤਿੰਨ ਗੁਣਾ ਸੁਧਾਰਦਾ ਹੈ। ਵਿਥਕਾਰ.<0.2, n=151, 0.2-0.8, n=67, 0.2-3, n=180, 0.8-20, n=30, >0.2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, OMD ਸਪੀਸੀਜ਼ ਕਲੱਸਟਰ ਪੱਧਰ (95% ਮਤਲਬ ਨਿਊਕਲੀਓਟਾਈਡ ਪਛਾਣ) ਵਿੱਚ ਸਮੂਹ ਦੀ ਕੁੱਲ ਪਛਾਣ ਕਰਦਾ ਹੈ ਲਗਭਗ 8300 ਸਪੀਸੀਜ਼, ਜਿਨ੍ਹਾਂ ਵਿੱਚੋਂ ਅੱਧੀਆਂ ਤੋਂ ਵੱਧ ਪਹਿਲਾਂ ਜੀਟੀਡੀਬੀ (ਵਰਜਨ 89) ਈ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਵਰਗੀਕਰਨ ਐਨੋਟੇਸ਼ਨਾਂ ਦੇ ਅਨੁਸਾਰ ਵਿਸ਼ੇਸ਼ਤਾ ਨਹੀਂ ਰੱਖੀਆਂ ਗਈਆਂ ਹਨ, ਜੀਨੋਮ ਕਿਸਮ ਦੁਆਰਾ ਪ੍ਰਜਾਤੀਆਂ ਦਾ ਵਰਗੀਕਰਨ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ MAG, SAG ਅਤੇ REFs ਦੀ ਫਾਈਲੋਜੈਨੇਟਿਕ ਵਿਭਿੰਨਤਾ ਨੂੰ ਦਰਸਾਉਣ ਵਿੱਚ ਇੱਕ ਦੂਜੇ ਦੇ ਪੂਰਕ ਹਨ। ਸਮੁੰਦਰੀ ਮਾਈਕ੍ਰੋਬਾਇਓਮ.ਖਾਸ ਤੌਰ 'ਤੇ, 55%, 26% ਅਤੇ 11% ਪ੍ਰਜਾਤੀਆਂ ਕ੍ਰਮਵਾਰ MAG, SAG ਅਤੇ REF ਲਈ ਵਿਸ਼ੇਸ਼ ਸਨ।BATS, ਬਰਮੂਡਾ ਐਟਲਾਂਟਿਕ ਟਾਈਮ ਸੀਰੀਜ਼;GEM, ਧਰਤੀ ਦੇ ਮਾਈਕ੍ਰੋਬਾਇਓਮ ਦੇ ਜੀਨੋਮ;GORG, ਗਲੋਬਲ ਸਮੁੰਦਰੀ ਹਵਾਲਾ ਜੀਨੋਮ;HOT, ਹਵਾਈ ਮਹਾਸਾਗਰ ਸਮਾਂ ਲੜੀ।
ਇਸ ਡੇਟਾਸੈਟ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਅਸੀਂ ਕੁੱਲ 26,293 MAGs ਦਾ ਪੁਨਰਗਠਨ ਕੀਤਾ, ਜ਼ਿਆਦਾਤਰ ਬੈਕਟੀਰੀਆ ਅਤੇ ਪੁਰਾਤੱਤਵ (Fig. 1b ਅਤੇ ਵਿਸਤ੍ਰਿਤ ਡੇਟਾ, Fig. 1b)।ਅਸੀਂ ਵੱਖ-ਵੱਖ ਸਥਾਨਾਂ ਜਾਂ ਸਮਾਂ ਬਿੰਦੂਆਂ (ਤਰੀਕਿਆਂ) ਦੇ ਨਮੂਨਿਆਂ ਦੇ ਵਿਚਕਾਰ ਕੁਦਰਤੀ ਕ੍ਰਮ ਪਰਿਵਰਤਨ ਦੇ ਪਤਨ ਨੂੰ ਰੋਕਣ ਲਈ ਪੂਲ ਕੀਤੇ ਮੈਟਾਜੇਨੋਮਿਕ ਨਮੂਨਿਆਂ ਦੀ ਬਜਾਏ ਵੱਖਰੇ ਅਸੈਂਬਲੀਆਂ ਤੋਂ ਇਹਨਾਂ MAGs ਨੂੰ ਬਣਾਇਆ ਹੈ।ਇਸ ਤੋਂ ਇਲਾਵਾ, ਅਸੀਂ ਵੱਡੀ ਗਿਣਤੀ ਵਿੱਚ ਨਮੂਨਿਆਂ ਵਿੱਚ ਉਹਨਾਂ ਦੇ ਪ੍ਰਚਲਿਤ ਸਬੰਧਾਂ ਦੇ ਆਧਾਰ 'ਤੇ ਜੀਨੋਮਿਕ ਟੁਕੜਿਆਂ ਨੂੰ ਸਮੂਹ ਕੀਤਾ (58 ਤੋਂ 610 ਨਮੂਨਿਆਂ ਤੱਕ, ਸਰਵੇਖਣ 'ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ; ਵਿਧੀ)।ਅਸੀਂ ਪਾਇਆ ਕਿ ਇਹ ਸਮਾਂ ਬਰਬਾਦ ਕਰਨ ਵਾਲਾ ਪਰ ਮਹੱਤਵਪੂਰਨ ਕਦਮ ਹੈ24 ਜਿਸ ਨੂੰ ਕਈ ਵੱਡੇ ਪੈਮਾਨੇ ਦੇ MAG16, 19, 25 ਪੁਨਰ ਨਿਰਮਾਣ ਕਾਰਜਾਂ ਵਿੱਚ ਛੱਡ ਦਿੱਤਾ ਗਿਆ ਸੀ ਅਤੇ ਇਸਦੀ ਮਾਤਰਾ (ਔਸਤਨ 2.7 ਗੁਣਾ) ਅਤੇ ਗੁਣਵੱਤਾ (ਔਸਤਨ +20%) ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰ ਕੀਤਾ ਗਿਆ ਸੀ। ਜੀਨੋਮਇੱਥੇ ਅਧਿਐਨ ਕੀਤੇ ਗਏ ਸਮੁੰਦਰੀ ਮੈਟਾਜੇਨੋਮ ਤੋਂ ਪੁਨਰਗਠਨ ਕੀਤਾ ਗਿਆ (ਵਿਸਤ੍ਰਿਤ ਡੇਟਾ, ਚਿੱਤਰ 2a ਅਤੇ ਵਾਧੂ ਜਾਣਕਾਰੀ)।ਕੁੱਲ ਮਿਲਾ ਕੇ, ਇਹਨਾਂ ਯਤਨਾਂ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਅੱਜ ਉਪਲਬਧ ਸਭ ਤੋਂ ਵਿਆਪਕ MAG ਸਰੋਤ 16 (ਤਰੀਕਿਆਂ) ਦੀ ਤੁਲਨਾ ਵਿੱਚ ਸਮੁੰਦਰੀ ਮਾਈਕ੍ਰੋਬਾਇਲ MAGs (6 ਗੁਣਾ ਜੇਕਰ ਸਿਰਫ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ MAGs ਨੂੰ ਮੰਨਿਆ ਜਾਂਦਾ ਹੈ) ਵਿੱਚ 4.5-ਗੁਣਾ ਵਾਧਾ ਹੋਇਆ ਹੈ।ਇਹ ਨਵਾਂ ਬਣਾਇਆ MAG ਸੈੱਟ ਫਿਰ 830 ਹੱਥ-ਚੁੱਕੇ MAG26s, 5969 SAG27s ਅਤੇ 1707 REFs ਨਾਲ ਜੋੜਿਆ ਗਿਆ ਸੀ।ਸਮੁੰਦਰੀ ਬੈਕਟੀਰੀਆ ਅਤੇ ਪੁਰਾਤੱਤਵ ਦੀਆਂ 27 ਕਿਸਮਾਂ ਨੇ 34,799 ਜੀਨੋਮ (ਚਿੱਤਰ 1ਬੀ) ਦਾ ਸੰਯੁਕਤ ਸੰਗ੍ਰਹਿ ਬਣਾਇਆ ਹੈ।
ਫਿਰ ਅਸੀਂ ਸਮੁੰਦਰੀ ਮਾਈਕ੍ਰੋਬਾਇਲ ਕਮਿਊਨਿਟੀਆਂ ਦੀ ਨੁਮਾਇੰਦਗੀ ਕਰਨ ਅਤੇ ਵੱਖ-ਵੱਖ ਜੀਨੋਮ ਕਿਸਮਾਂ ਨੂੰ ਏਕੀਕ੍ਰਿਤ ਕਰਨ ਦੇ ਪ੍ਰਭਾਵ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣ ਲਈ ਨਵੇਂ ਬਣਾਏ ਸਰੋਤ ਦਾ ਮੁਲਾਂਕਣ ਕੀਤਾ।ਔਸਤਨ, ਅਸੀਂ ਪਾਇਆ ਕਿ ਇਹ ਸਮੁੰਦਰੀ ਮੈਟਾਜੇਨੋਮਿਕ ਡੇਟਾ (ਚਿੱਤਰ 1c) ਦੇ ਲਗਭਗ 40-60% ਨੂੰ ਕਵਰ ਕਰਦਾ ਹੈ, ਡੂੰਘਾਈ ਅਤੇ ਅਕਸ਼ਾਂਸ਼ ਦੋਵਾਂ ਵਿੱਚ ਪਿਛਲੀਆਂ MAG-ਸਿਰਫ ਰਿਪੋਰਟਾਂ ਦੀ ਕਵਰੇਜ ਤੋਂ ਦੋ ਤੋਂ ਤਿੰਨ ਗੁਣਾ ਵਧੇਰੇ ਸੀਰੀਅਲ 16 ਜਾਂ SAG20।ਇਸ ਤੋਂ ਇਲਾਵਾ, ਸਥਾਪਿਤ ਸੰਗ੍ਰਹਿ ਵਿੱਚ ਵਰਗੀਕਰਨ ਵਿਭਿੰਨਤਾ ਨੂੰ ਵਿਵਸਥਿਤ ਰੂਪ ਵਿੱਚ ਮਾਪਣ ਲਈ, ਅਸੀਂ ਜੀਨੋਮ ਟੈਕਸੋਨੋਮੀ ਡੇਟਾਬੇਸ (GTDB) ਟੂਲਕਿੱਟ (ਤਰੀਕਿਆਂ) ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਸਾਰੇ ਜੀਨੋਮ ਦੀ ਵਿਆਖਿਆ ਕੀਤੀ ਅਤੇ 95% ਦੀ ਔਸਤਨ ਜੀਨੋਮ-ਵਿਆਪਕ ਨਿਊਕਲੀਓਟਾਈਡ ਪਛਾਣ ਦੀ ਵਰਤੋਂ ਕੀਤੀ।8,304 ਸਪੀਸੀਜ਼ ਕਲੱਸਟਰ (ਸਪੀਸੀਜ਼) ਦੀ ਪਛਾਣ ਕਰਨ ਲਈ 28.ਇਹਨਾਂ ਵਿੱਚੋਂ ਦੋ-ਤਿਹਾਈ ਕਿਸਮਾਂ (ਨਵੇਂ ਕਲੇਡਾਂ ਸਮੇਤ) ਪਹਿਲਾਂ GTDB ਵਿੱਚ ਪ੍ਰਗਟ ਨਹੀਂ ਹੋਈਆਂ ਸਨ, ਜਿਨ੍ਹਾਂ ਵਿੱਚੋਂ 2790 ਨੂੰ ਇਸ ਅਧਿਐਨ (ਚਿੱਤਰ 1d) ਵਿੱਚ ਪੁਨਰਗਠਿਤ MAG ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਖੋਜਿਆ ਗਿਆ ਸੀ।ਇਸ ਤੋਂ ਇਲਾਵਾ, ਅਸੀਂ ਪਾਇਆ ਕਿ ਵੱਖ-ਵੱਖ ਕਿਸਮਾਂ ਦੇ ਜੀਨੋਮ ਬਹੁਤ ਜ਼ਿਆਦਾ ਪੂਰਕ ਹਨ: 55%, 26%, ਅਤੇ 11% ਪ੍ਰਜਾਤੀਆਂ ਕ੍ਰਮਵਾਰ MAG, SAG, ਅਤੇ REF ਨਾਲ ਬਣੀਆਂ ਹਨ (ਚਿੱਤਰ 1e)।ਇਸ ਤੋਂ ਇਲਾਵਾ, MAG ਨੇ ਪਾਣੀ ਦੇ ਕਾਲਮ ਵਿੱਚ ਪਾਈਆਂ ਗਈਆਂ ਸਾਰੀਆਂ 49 ਕਿਸਮਾਂ ਨੂੰ ਕਵਰ ਕੀਤਾ, ਜਦੋਂ ਕਿ SAG ਅਤੇ REF ਨੇ ਕ੍ਰਮਵਾਰ ਉਹਨਾਂ ਵਿੱਚੋਂ ਸਿਰਫ 18 ਅਤੇ 11 ਨੂੰ ਦਰਸਾਇਆ।ਹਾਲਾਂਕਿ, SAG ਸਭ ਤੋਂ ਆਮ ਕਲੇਡਾਂ (ਵਿਸਤ੍ਰਿਤ ਡੇਟਾ, ਚਿੱਤਰ 3a) ਦੀ ਵਿਭਿੰਨਤਾ ਨੂੰ ਬਿਹਤਰ ਢੰਗ ਨਾਲ ਦਰਸਾਉਂਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ ਪੇਲਾਗਿਕ ਬੈਕਟੀਰੀਅਲਜ਼ (SAR11), ਜਿਸ ਵਿੱਚ SAG ਲਗਭਗ 1300 ਪ੍ਰਜਾਤੀਆਂ ਅਤੇ MAG ਕੇਵਲ 390 ਪ੍ਰਜਾਤੀਆਂ ਨੂੰ ਕਵਰ ਕਰਦਾ ਹੈ।ਖਾਸ ਤੌਰ 'ਤੇ, REFs ਪ੍ਰਜਾਤੀ ਪੱਧਰ 'ਤੇ MAGs ਜਾਂ SAGs ਨਾਲ ਘੱਟ ਹੀ ਓਵਰਲੈਪ ਹੁੰਦੇ ਹਨ ਅਤੇ ਇੱਥੇ ਅਧਿਐਨ ਕੀਤੇ ਗਏ ਖੁੱਲੇ ਸਮੁੰਦਰ ਦੇ ਮੈਟੇਜਨੋਮਿਕ ਸੈੱਟਾਂ ਵਿੱਚ ਨਹੀਂ ਪਾਏ ਗਏ ਲਗਭਗ 1000 ਜੀਨੋਮ ਦੇ 95% ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ, ਮੁੱਖ ਤੌਰ 'ਤੇ ਹੋਰ ਕਿਸਮਾਂ ਦੇ ਅਲੱਗ-ਥਲੱਗ ਪ੍ਰਤੀਨਿਧ ਸਮੁੰਦਰੀ ਨਮੂਨੇ (ਜਿਵੇਂ ਕਿ ਤਲਛਟ) ਨਾਲ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਕਾਰਨ। .ਜਾਂ ਹੋਸਟ-ਐਸੋਸੀਏਟ)।ਇਸ ਨੂੰ ਵਿਗਿਆਨਕ ਭਾਈਚਾਰੇ ਲਈ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਉਪਲਬਧ ਕਰਾਉਣ ਲਈ, ਇਸ ਸਮੁੰਦਰੀ ਜੀਨੋਮ ਸਰੋਤ, ਜਿਸ ਵਿੱਚ ਗੈਰ-ਵਰਗੀਕ੍ਰਿਤ ਟੁਕੜੇ ਵੀ ਸ਼ਾਮਲ ਹਨ (ਉਦਾਹਰਨ ਲਈ, ਪੂਰਵ-ਅਨੁਮਾਨਿਤ ਫੇਜ਼ਾਂ, ਜੀਨੋਮਿਕ ਟਾਪੂਆਂ, ਅਤੇ ਜੀਨੋਮ ਦੇ ਟੁਕੜੇ ਜਿਨ੍ਹਾਂ ਲਈ MAG ਪੁਨਰ-ਨਿਰਮਾਣ ਲਈ ਨਾਕਾਫ਼ੀ ਡੇਟਾ ਹੈ), ਦੀ ਤੁਲਨਾ ਟੈਕਸੋਨੋਮਿਕ ਡੇਟਾ ਨਾਲ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ। .ਓਸ਼ੀਅਨ ਮਾਈਕ੍ਰੋਬਾਇਓਲੋਜੀ ਡੇਟਾਬੇਸ (OMD; https://microbiomics.io/ocean/) ਵਿੱਚ ਜੀਨ ਫੰਕਸ਼ਨ ਅਤੇ ਪ੍ਰਸੰਗਿਕ ਮਾਪਦੰਡਾਂ ਦੇ ਨਾਲ ਐਨੋਟੇਸ਼ਨਾਂ ਤੱਕ ਪਹੁੰਚ ਕਰੋ।
ਫਿਰ ਅਸੀਂ ਖੁੱਲੇ ਸਮੁੰਦਰੀ ਮਾਈਕ੍ਰੋਬਾਇਓਮਜ਼ ਵਿੱਚ ਬਾਇਓਸਿੰਥੈਟਿਕ ਸੰਭਾਵਨਾਵਾਂ ਦੀ ਅਮੀਰੀ ਅਤੇ ਨਵੀਨਤਾ ਦੀ ਪੜਚੋਲ ਕਰਨ ਲਈ ਤਿਆਰ ਹੋਏ।ਇਸ ਲਈ, ਅਸੀਂ ਸਭ ਤੋਂ ਪਹਿਲਾਂ ਕੁੱਲ 39,055 BGCs ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਲਈ 1038 ਸਮੁੰਦਰੀ ਮੈਟਾਜੇਨੋਮ (ਤਰੀਕਿਆਂ) ਵਿੱਚ ਪਾਏ ਗਏ ਸਾਰੇ MAGs, SAGs, ਅਤੇ REFs ਲਈ antiSMASH ਦੀ ਵਰਤੋਂ ਕੀਤੀ।ਅਸੀਂ ਫਿਰ ਇਹਨਾਂ ਨੂੰ 6907 ਗੈਰ-ਰਿਡੰਡੈਂਟ GCFs ਅਤੇ 151 ਜੀਨ ਕਲੱਸਟਰ ਆਬਾਦੀ (GCCs; ਸਪਲੀਮੈਂਟਰੀ ਟੇਬਲ 2 ਅਤੇ ਵਿਧੀਆਂ) ਵਿੱਚ ਅੰਦਰੂਨੀ ਰਿਡੰਡੈਂਸੀ (ਭਾਵ, ਇੱਕੋ BGC ਨੂੰ ਮਲਟੀਪਲ ਜੀਨੋਮ ਵਿੱਚ ਏਨਕੋਡ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ) ਅਤੇ BGC ਕੇਂਦ੍ਰਤ ਦੇ ਮੈਟੇਜੈਨੋਮਿਕ ਡੇਟਾ ਦੇ ਫ੍ਰੈਗਮੈਂਟੇਸ਼ਨ ਵਿੱਚ ਸਮੂਹਬੱਧ ਕੀਤਾ।44% ਅਤੇ 86% ਮਾਮਲਿਆਂ ਵਿੱਚ ਘੱਟੋ-ਘੱਟ ਇੱਕ ਬਰਕਰਾਰ BGC ਮੈਂਬਰ ਵਾਲੇ ਕ੍ਰਮਵਾਰ GCFs ਅਤੇ GCCs ਦੀ ਸੰਖਿਆ, ਜੇਕਰ ਕੋਈ ਹੋਵੇ (ਪੂਰਕ ਜਾਣਕਾਰੀ) ਵਿੱਚ ਅਧੂਰੇ BGCs ਨੇ ਮਹੱਤਵਪੂਰਨ ਵਾਧਾ ਨਹੀਂ ਕੀਤਾ।
GCC ਪੱਧਰ 'ਤੇ, ਸਾਨੂੰ ਪੂਰਵ-ਅਨੁਮਾਨਿਤ RiPPs ਅਤੇ ਹੋਰ ਕੁਦਰਤੀ ਉਤਪਾਦਾਂ (ਚਿੱਤਰ 2a) ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਕਿਸਮ ਮਿਲੀ।ਉਹਨਾਂ ਵਿੱਚੋਂ, ਉਦਾਹਰਨ ਲਈ, ਐਰੀਲਪੋਲੀਨੇਸ, ਕੈਰੋਟੀਨੋਇਡਜ਼, ਐਕਟੋਇਨਜ਼, ਅਤੇ ਸਾਈਡਰੋਫੋਰਸ ਇੱਕ ਵਿਆਪਕ ਫਾਈਲੋਜੈਨੀਟਿਕ ਵੰਡ ਅਤੇ ਸਮੁੰਦਰੀ ਮੈਟਾਜੇਨੋਮਜ਼ ਵਿੱਚ ਇੱਕ ਉੱਚ ਭਰਪੂਰਤਾ ਵਾਲੇ ਜੀਸੀਸੀ ਨਾਲ ਸਬੰਧਤ ਹਨ, ਜੋ ਸਮੁੰਦਰੀ ਵਾਤਾਵਰਣ ਵਿੱਚ ਸੂਖਮ ਜੀਵਾਣੂਆਂ ਦੇ ਵਿਆਪਕ ਅਨੁਕੂਲਤਾ ਨੂੰ ਦਰਸਾ ਸਕਦੇ ਹਨ, ਜਿਸ ਵਿੱਚ ਪ੍ਰਤੀਕਿਰਿਆਸ਼ੀਲ ਆਕਸੀਜਨ ਦੇ ਪ੍ਰਤੀਰੋਧ ਸ਼ਾਮਲ ਹਨ। oxidative ਅਤੇ osmotic ਤਣਾਅ..ਜਾਂ ਆਇਰਨ ਸਮਾਈ (ਵਧੇਰੇ ਜਾਣਕਾਰੀ)।ਇਹ ਕਾਰਜਸ਼ੀਲ ਵਿਭਿੰਨਤਾ NCBI RefSeq ਡੇਟਾਬੇਸ (BiG-FAM/RefSeq, ਇਸ ਤੋਂ ਬਾਅਦ RefSeq) ਵਿੱਚ ਸਟੋਰ ਕੀਤੇ ਗਏ ਲਗਭਗ 190,000 ਜੀਨੋਮ ਵਿੱਚੋਂ ਲਗਭਗ 1.2 ਮਿਲੀਅਨ BGCs ਦੇ ਇੱਕ ਤਾਜ਼ਾ ਵਿਸ਼ਲੇਸ਼ਣ ਦੇ ਨਾਲ ਵਿਪਰੀਤ ਹੈ। ਆਈਡੀ ਸਿੰਥੇਸ (PKS) BGCs (ਪੂਰਕ ਜਾਣਕਾਰੀ)।ਸਾਨੂੰ 44 (29%) GCCs ਸਿਰਫ MAG ਵਿੱਚ ਕਿਸੇ ਵੀ RefSeq BGC (\(\bar{d}\)RefSeq > 0.4; Fig. 2a ਅਤੇ ਵਿਧੀਆਂ) ਅਤੇ 53 (35%) GCCs ਨਾਲ ਸਬੰਧਤ ਹਨ, ਸੰਭਾਵੀ ਨੂੰ ਉਜਾਗਰ ਕਰਦੇ ਹੋਏ। OMD ਵਿੱਚ ਪਹਿਲਾਂ ਨਾ ਦੱਸੇ ਗਏ ਰਸਾਇਣਾਂ ਦਾ ਪਤਾ ਲਗਾਉਣ ਲਈ।ਇਹ ਦੇਖਦੇ ਹੋਏ ਕਿ ਇਹਨਾਂ ਵਿੱਚੋਂ ਹਰੇਕ GCC ਸੰਭਾਵਤ ਤੌਰ 'ਤੇ ਬਹੁਤ ਹੀ ਵਿਭਿੰਨ ਬਾਇਓਸਿੰਥੈਟਿਕ ਫੰਕਸ਼ਨਾਂ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਅਸੀਂ ਸਮਾਨ ਕੁਦਰਤੀ ਉਤਪਾਦਾਂ ਲਈ ਕੋਡ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕੀਤੇ BGCs ਦੇ ਵਧੇਰੇ ਵਿਸਤ੍ਰਿਤ ਸਮੂਹ ਪ੍ਰਦਾਨ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਵਿੱਚ GCF ਪੱਧਰ 'ਤੇ ਡੇਟਾ ਦਾ ਹੋਰ ਵਿਸ਼ਲੇਸ਼ਣ ਕੀਤਾ।ਕੁੱਲ 3861 (56%) ਪਛਾਣੇ ਗਏ GCFs RefSeq ਨਾਲ ਓਵਰਲੈਪ ਨਹੀਂ ਹੋਏ, ਅਤੇ > 97% GCF MIBiG ਵਿੱਚ ਮੌਜੂਦ ਨਹੀਂ ਸਨ, ਪ੍ਰਯੋਗਾਤਮਕ ਤੌਰ 'ਤੇ ਪ੍ਰਮਾਣਿਤ BGCs (ਚਿੱਤਰ 2b) ਦੇ ਸਭ ਤੋਂ ਵੱਡੇ ਡੇਟਾਬੇਸ ਵਿੱਚੋਂ ਇੱਕ।ਹਾਲਾਂਕਿ ਸੈਟਿੰਗਾਂ ਵਿੱਚ ਬਹੁਤ ਸਾਰੇ ਸੰਭਾਵੀ ਨਾਵਲ ਮਾਰਗਾਂ ਨੂੰ ਖੋਜਣਾ ਕੋਈ ਹੈਰਾਨੀ ਵਾਲੀ ਗੱਲ ਨਹੀਂ ਹੈ ਜੋ ਸੰਦਰਭ ਜੀਨੋਮ ਦੁਆਰਾ ਚੰਗੀ ਤਰ੍ਹਾਂ ਪ੍ਰਸਤੁਤ ਨਹੀਂ ਕੀਤੇ ਗਏ ਹਨ, ਬੈਂਚਮਾਰਕਿੰਗ ਤੋਂ ਪਹਿਲਾਂ BGCs ਨੂੰ GCF ਵਿੱਚ ਦੁਹਰਾਉਣ ਦਾ ਸਾਡਾ ਤਰੀਕਾ ਪਿਛਲੀਆਂ ਰਿਪੋਰਟਾਂ 16 ਤੋਂ ਵੱਖਰਾ ਹੈ ਅਤੇ ਸਾਨੂੰ ਨਵੀਨਤਾ ਦਾ ਨਿਰਪੱਖ ਮੁਲਾਂਕਣ ਪ੍ਰਦਾਨ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ।ਜ਼ਿਆਦਾਤਰ ਨਵੀਂ ਵਿਭਿੰਨਤਾ (3012 GCF ਜਾਂ 78%) ਪੂਰਵ-ਅਨੁਮਾਨਿਤ ਟੇਰਪੇਨਸ, RiPP ਜਾਂ ਹੋਰ ਕੁਦਰਤੀ ਉਤਪਾਦਾਂ ਨਾਲ ਮੇਲ ਖਾਂਦੀ ਹੈ, ਅਤੇ ਜ਼ਿਆਦਾਤਰ (1815 GCF ਜਾਂ 47%) ਉਹਨਾਂ ਦੀ ਬਾਇਓਸਿੰਥੈਟਿਕ ਸਮਰੱਥਾ ਦੇ ਕਾਰਨ ਅਣਜਾਣ ਕਿਸਮਾਂ ਵਿੱਚ ਏਨਕੋਡ ਕੀਤੇ ਗਏ ਹਨ।PKS ਅਤੇ NRPS ਕਲੱਸਟਰਾਂ ਦੇ ਉਲਟ, ਇਹ ਸੰਖੇਪ BGCs ਦੇ ਮੈਟਾਜੇਨੋਮਿਕ ਅਸੈਂਬਲੀ 31 ਦੇ ਦੌਰਾਨ ਖੰਡਿਤ ਹੋਣ ਦੀ ਸੰਭਾਵਨਾ ਘੱਟ ਹੁੰਦੀ ਹੈ ਅਤੇ ਉਹਨਾਂ ਦੇ ਉਤਪਾਦਾਂ ਦੇ ਵਧੇਰੇ ਸਮਾਂ-ਅਤੇ ਸਰੋਤ-ਸੰਬੰਧਿਤ ਕਾਰਜਸ਼ੀਲ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੀ ਆਗਿਆ ਦਿੰਦੇ ਹਨ।
ਕੁੱਲ 39,055 BGCs ਨੂੰ 6,907 GCF ਅਤੇ 151 GCC ਵਿੱਚ ਵੰਡਿਆ ਗਿਆ ਸੀ।a, ਡੇਟਾ ਪ੍ਰਤੀਨਿਧਤਾ (ਅੰਦਰੂਨੀ ਬਾਹਰੀ)।GCC 'ਤੇ ਆਧਾਰਿਤ BGC ਦੂਰੀਆਂ ਦੇ ਲੜੀਵਾਰ ਕਲੱਸਟਰਿੰਗ, ਜਿਨ੍ਹਾਂ ਵਿੱਚੋਂ 53 ਸਿਰਫ਼ MAG ਦੁਆਰਾ ਨਿਸ਼ਚਿਤ ਕੀਤੇ ਗਏ ਹਨ।GCC ਵਿੱਚ ਵੱਖ-ਵੱਖ ਟੈਕਸਾ (ln-ਟਰਾਂਸਫਾਰਮਡ ਗੇਟ ਫ੍ਰੀਕੁਐਂਸੀ) ਅਤੇ ਵੱਖ-ਵੱਖ BGC ਕਲਾਸਾਂ (ਸਰਕਲ ਦਾ ਆਕਾਰ ਇਸਦੀ ਬਾਰੰਬਾਰਤਾ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੈ) ਦੇ BGC ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ।ਹਰੇਕ GCC ਲਈ, ਬਾਹਰੀ ਪਰਤ BGCs ਦੀ ਸੰਖਿਆ, ਪ੍ਰਚਲਣ (ਨਮੂਨਿਆਂ ਦੀ ਪ੍ਰਤੀਸ਼ਤਤਾ), ਅਤੇ ਦੂਰੀ (ਘੱਟੋ-ਘੱਟ BGC ਕੋਸਾਈਨ ਦੂਰੀ (min(dMIBiG))) BiG-FAM ਤੋਂ BGC ਤੱਕ ਦਰਸਾਉਂਦੀ ਹੈ।BGCs ਵਾਲੇ GCCs ਨੂੰ ਪ੍ਰਯੋਗਾਤਮਕ ਤੌਰ 'ਤੇ ਪ੍ਰਮਾਣਿਤ BGCs (MIBiG) ਨਾਲ ਨੇੜਿਓਂ ਸਬੰਧਤ ਤੀਰਾਂ ਨਾਲ ਉਜਾਗਰ ਕੀਤਾ ਗਿਆ ਹੈ।b ਪੂਰਵ ਅਨੁਮਾਨਿਤ (BiG-FAM) ਅਤੇ ਪ੍ਰਯੋਗਾਤਮਕ ਤੌਰ 'ਤੇ ਪ੍ਰਮਾਣਿਤ (MIBiG) BGCs ਨਾਲ GCF ਦੀ ਤੁਲਨਾ ਕਰਦੇ ਹੋਏ, 3861 ਨਵੇਂ (d–>0.2) GCF ਪਾਏ ਗਏ ਸਨ।ਇਹਨਾਂ ਵਿੱਚੋਂ ਜ਼ਿਆਦਾਤਰ (78%) RiPP, ਟੇਰਪੇਨਸ, ਅਤੇ ਹੋਰ ਕੁਦਰਤੀ ਉਤਪਾਦਾਂ ਲਈ ਕੋਡ।c, 1038 ਸਮੁੰਦਰੀ ਮੈਟਾਜੇਨੋਮ ਵਿੱਚ ਪਾਏ ਗਏ OMD ਵਿੱਚ ਸਾਰੇ ਜੀਨੋਮ OMD ਦੇ ਫਾਈਲੋਜੈਨੇਟਿਕ ਕਵਰੇਜ ਨੂੰ ਦਿਖਾਉਣ ਲਈ GTDB ਬੇਸ ਟ੍ਰੀ ਵਿੱਚ ਰੱਖੇ ਗਏ ਸਨ।OMD ਵਿੱਚ ਬਿਨਾਂ ਕਿਸੇ ਜੀਨੋਮ ਦੇ ਕਲੇਡ ਸਲੇਟੀ ਵਿੱਚ ਦਿਖਾਏ ਗਏ ਹਨ।BGCs ਦੀ ਸੰਖਿਆ ਇੱਕ ਦਿੱਤੇ ਗਏ ਕਲੇਡ ਵਿੱਚ ਪ੍ਰਤੀ ਜੀਨੋਮ ਵਿੱਚ ਅਨੁਮਾਨਿਤ BGCs ਦੀ ਸਭ ਤੋਂ ਵੱਡੀ ਸੰਖਿਆ ਨਾਲ ਮੇਲ ਖਾਂਦੀ ਹੈ।ਸਪੱਸ਼ਟਤਾ ਲਈ, ਪਿਛਲੇ 15% ਨੋਡਾਂ ਨੂੰ ਸਮੇਟਿਆ ਗਿਆ ਹੈ.ਤੀਰ ਮਾਈਕੋਬੈਕਟੀਰੀਅਮ, ਗੋਰਡੋਨੀਆ (ਸਿਰਫ ਰੋਡੋਕੋਕਸ ਤੋਂ ਦੂਜੇ) ਅਤੇ ਕ੍ਰੋਕੋਸਫੇਰਾ (ਸਿਰਫ ਸਿਨੇਕੋਕੋਕਸ ਤੋਂ ਦੂਜੇ) ਦੇ ਅਪਵਾਦ ਦੇ ਨਾਲ, BGC (>15 BGC) ਵਿੱਚ ਅਮੀਰ ਕਲੇਡਾਂ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ।d, ਅਗਿਆਤ ਸੀ.Eremiobacterota ਨੇ ਸਭ ਤੋਂ ਵੱਧ ਬਾਇਓਸਿੰਥੈਟਿਕ ਵਿਭਿੰਨਤਾ (ਕੁਦਰਤੀ ਉਤਪਾਦ ਕਿਸਮ ਦੇ ਅਧਾਰ ਤੇ ਸ਼ੈਨਨ ਸੂਚਕਾਂਕ) ਦਿਖਾਇਆ।ਹਰ ਬੈਂਡ ਸਪੀਸੀਜ਼ ਵਿੱਚ ਸਭ ਤੋਂ ਵੱਧ BGCs ਵਾਲੇ ਜੀਨੋਮ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ।T1PKS, PKS ਕਿਸਮ I, T2/3PKS, PKS ਕਿਸਮ II ਅਤੇ ਕਿਸਮ III।
ਅਮੀਰੀ ਅਤੇ ਨਵੀਨਤਾ ਤੋਂ ਇਲਾਵਾ, ਅਸੀਂ ਸਮੁੰਦਰੀ ਮਾਈਕ੍ਰੋਬਾਇਓਮ ਦੀ ਬਾਇਓਸਿੰਥੈਟਿਕ ਸੰਭਾਵੀ ਦੇ ਜੀਵ-ਭੂਗੋਲਿਕ ਢਾਂਚੇ ਦੀ ਪੜਚੋਲ ਕਰਦੇ ਹਾਂ।ਔਸਤ ਮੈਟਾਜੇਨੋਮਿਕ GCF ਕਾਪੀ ਨੰਬਰ ਡਿਸਟ੍ਰੀਬਿਊਸ਼ਨ (ਤਰੀਕਿਆਂ) ਦੁਆਰਾ ਨਮੂਨਿਆਂ ਦਾ ਸਮੂਹ ਕਰਨਾ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਘੱਟ-ਅਕਸ਼ਾਂਸ਼, ਸਤਹ, ਪ੍ਰੋਕੈਰੀਓਟਿਕ-ਅਮੀਰ ਅਤੇ ਵਾਇਰਸ-ਗਰੀਬ ਸਮੁਦਾਇਆਂ, ਜ਼ਿਆਦਾਤਰ ਸਤਹ ਜਾਂ ਡੂੰਘੇ ਧੁੱਪ ਵਾਲੇ ਪਾਣੀਆਂ ਤੋਂ, RiPP ਅਤੇ BGC ਟੇਰਪੇਨਸ ਨਾਲ ਭਰਪੂਰ ਸਨ।ਇਸ ਦੇ ਉਲਟ, ਧਰੁਵੀ, ਡੂੰਘੇ-ਸਮੁੰਦਰ, ਵਾਇਰਸ- ਅਤੇ ਕਣ-ਅਮੀਰ ਸਮੁਦਾਇਆਂ NRPS ਅਤੇ PKS BGC (ਵਿਸਤ੍ਰਿਤ ਡੇਟਾ, ਚਿੱਤਰ 4 ਅਤੇ ਵਾਧੂ ਜਾਣਕਾਰੀ) ਦੀ ਵਧੇਰੇ ਭਰਪੂਰਤਾ ਨਾਲ ਜੁੜੇ ਹੋਏ ਸਨ।ਅੰਤ ਵਿੱਚ, ਅਸੀਂ ਪਾਇਆ ਕਿ ਚੰਗੀ ਤਰ੍ਹਾਂ ਅਧਿਐਨ ਕੀਤੇ ਗਰਮ ਖੰਡੀ ਅਤੇ ਪੇਲਾਜਿਕ ਸਮੁਦਾਇਆਂ ਨਵੇਂ ਟੇਰਪੇਨਸ (ਵਧੇ ਹੋਏ ਡੇਟਾ ਚਿੱਤਰ) ਦੇ ਸਭ ਤੋਂ ਵੱਧ ਉੱਨਤ ਸਰੋਤ ਹਨ।PKS, RiPP ਅਤੇ ਹੋਰ ਕੁਦਰਤੀ ਉਤਪਾਦਾਂ ਲਈ ਸਭ ਤੋਂ ਵੱਧ ਸੰਭਾਵਨਾਵਾਂ (ਵਿਸਤ੍ਰਿਤ ਡੇਟਾ ਦੇ ਨਾਲ ਚਿੱਤਰ 5a)।
ਸਮੁੰਦਰੀ ਮਾਈਕ੍ਰੋਬਾਇਓਮਜ਼ ਦੀ ਬਾਇਓਸਿੰਥੈਟਿਕ ਸਮਰੱਥਾ ਦੇ ਸਾਡੇ ਅਧਿਐਨ ਨੂੰ ਪੂਰਾ ਕਰਨ ਲਈ, ਅਸੀਂ ਉਹਨਾਂ ਦੇ ਫਾਈਲੋਜੈਨੇਟਿਕ ਵੰਡ ਨੂੰ ਮੈਪ ਕਰਨਾ ਅਤੇ ਨਵੇਂ BGC-ਸੰਪੂਰਨ ਕਲੇਡਾਂ ਦੀ ਪਛਾਣ ਕਰਨਾ ਸੀ।ਇਸ ਅੰਤ ਲਈ, ਅਸੀਂ ਸਮੁੰਦਰੀ ਰੋਗਾਣੂਆਂ ਦੇ ਜੀਨੋਮ ਨੂੰ ਇੱਕ ਸਧਾਰਣ GTDB13 ਬੈਕਟੀਰੀਅਲ ਅਤੇ ਪੁਰਾਤੱਤਵ ਫਾਈਲੋਜੈਨੇਟਿਕ ਟ੍ਰੀ ਵਿੱਚ ਰੱਖਿਆ ਅਤੇ ਉਹਨਾਂ ਦੁਆਰਾ ਏਨਕੋਡ ਕੀਤੇ ਪੁਟੇਟਿਵ ਬਾਇਓਸਿੰਥੈਟਿਕ ਮਾਰਗਾਂ ਨੂੰ ਓਵਰਲੇ ਕੀਤਾ (ਚਿੱਤਰ 2c)।ਅਸੀਂ ਸਮੁੰਦਰੀ ਪਾਣੀ ਦੇ ਨਮੂਨਿਆਂ (ਵਿਧੀਆਂ) ਵਿੱਚ ਕਈ BGC-ਅਨੁਕੂਲਿਤ ਕਲੇਡਾਂ (15 ਤੋਂ ਵੱਧ BGCs ਦੁਆਰਾ ਪ੍ਰਸਤੁਤ ਕੀਤੇ) ਨੂੰ ਆਸਾਨੀ ਨਾਲ ਖੋਜਿਆ ਹੈ, ਜੋ ਕਿ ਉਹਨਾਂ ਦੀ ਬਾਇਓਸਿੰਥੈਟਿਕ ਸਮਰੱਥਾ ਲਈ ਜਾਣੇ ਜਾਂਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ ਸਾਈਨੋਬੈਕਟੀਰੀਆ (ਸਿਨੇਕੋਕੋਕਸ) ਅਤੇ ਪ੍ਰੋਟੀਅਸ ਬੈਕਟੀਰੀਆ, ਜਿਵੇਂ ਕਿ ਟਿਸਟ੍ਰੇਲਾ 32,33, ਜਾਂ ਹਾਲ ਹੀ ਵਿੱਚ ਉਹਨਾਂ ਲਈ ਧਿਆਨ ਖਿੱਚਿਆ ਗਿਆ ਹੈ ਕੁਦਰਤੀ ਉਤਪਾਦ.ਜਿਵੇਂ ਕਿ ਮਾਈਕਸਕੋਕੋਟਾ (ਸੈਂਡਰਾਸੀਨੇਸੀ), ਰੋਡੋਕੋਕਸ ਅਤੇ ਪਲੈਨਕਟੋਮਾਈਸੀਟੋਟਾ34,35,36।ਦਿਲਚਸਪ ਗੱਲ ਇਹ ਹੈ ਕਿ, ਸਾਨੂੰ ਇਹਨਾਂ ਕਲੇਡਾਂ ਵਿੱਚ ਕਈ ਪਹਿਲਾਂ ਅਣਪਛਾਤੇ ਵੰਸ਼ ਮਿਲੇ ਹਨ।ਉਦਾਹਰਨ ਲਈ, ਫਾਈਲਾ ਪਲੈਨਕਟੋਮਾਈਸੀਟੋਟਾ ਅਤੇ ਮਾਈਕਸੋਕੋਕਾਟਾ ਵਿੱਚ ਸਭ ਤੋਂ ਅਮੀਰ ਬਾਇਓਸਿੰਥੈਟਿਕ ਸਮਰੱਥਾ ਵਾਲੀਆਂ ਉਹ ਪ੍ਰਜਾਤੀਆਂ ਕ੍ਰਮਵਾਰ ਗੈਰ-ਚਰਿੱਤਰਹੀਣ ਉਮੀਦਵਾਰ ਆਦੇਸ਼ਾਂ ਅਤੇ ਪੀੜ੍ਹੀਆਂ ਨਾਲ ਸਬੰਧਤ ਸਨ (ਪੂਰਕ ਸਾਰਣੀ 3)।ਇਕੱਠੇ ਕੀਤੇ ਗਏ, ਇਹ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ OMD ਪਹਿਲਾਂ ਤੋਂ ਅਣਜਾਣ ਫਾਈਲੋਜੈਨੇਟਿਕ ਜਾਣਕਾਰੀ ਤੱਕ ਪਹੁੰਚ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਸੂਖਮ ਜੀਵਾਣੂ ਸ਼ਾਮਲ ਹਨ, ਜੋ ਐਨਜ਼ਾਈਮ ਅਤੇ ਕੁਦਰਤੀ ਉਤਪਾਦ ਖੋਜ ਲਈ ਨਵੇਂ ਟੀਚਿਆਂ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ।
ਅੱਗੇ, ਅਸੀਂ ਨਾ ਸਿਰਫ਼ ਇਸਦੇ ਮੈਂਬਰਾਂ ਦੁਆਰਾ ਏਨਕੋਡ ਕੀਤੇ BGCs ਦੀ ਵੱਧ ਤੋਂ ਵੱਧ ਗਿਣਤੀ ਦੀ ਗਿਣਤੀ ਕਰਕੇ, ਸਗੋਂ ਇਹਨਾਂ BGCs ਦੀ ਵਿਭਿੰਨਤਾ ਦਾ ਮੁਲਾਂਕਣ ਕਰਕੇ, ਜੋ ਕਿ ਵੱਖ-ਵੱਖ ਕਿਸਮਾਂ ਦੇ ਕੁਦਰਤੀ ਉਮੀਦਵਾਰ ਉਤਪਾਦਾਂ (ਚਿੱਤਰ 2c ਅਤੇ ਵਿਧੀਆਂ) ਦੀ ਬਾਰੰਬਾਰਤਾ ਦੀ ਵਿਆਖਿਆ ਕਰਦਾ ਹੈ, BGC-ਅਨੁਕੂਲਿਤ ਕਲੇਡ ਦੀ ਵਿਸ਼ੇਸ਼ਤਾ ਕੀਤੀ ਹੈ। )..ਅਸੀਂ ਪਾਇਆ ਕਿ ਇਸ ਅਧਿਐਨ ਵਿੱਚ ਸਭ ਤੋਂ ਵੱਧ ਬਾਇਓਸਿੰਥੈਟਿਕ ਤੌਰ 'ਤੇ ਵਿਭਿੰਨ ਪ੍ਰਜਾਤੀਆਂ ਨੂੰ ਵਿਸ਼ੇਸ਼ ਤੌਰ 'ਤੇ ਇੰਜਨੀਅਰਡ ਬੈਕਟੀਰੀਆ MAGs ਦੁਆਰਾ ਦਰਸਾਇਆ ਗਿਆ ਸੀ।ਇਹ ਬੈਕਟੀਰੀਆ ਅਣ-ਕਲਾਟੀ ਫਾਈਲਮ ਕੈਂਡੀਡੇਟਸ ਏਰੀਮੀਓਬੈਕਟੀਰੋਟਾ ਨਾਲ ਸਬੰਧਤ ਹਨ, ਜੋ ਕਿ ਕੁਝ ਜੀਨੋਮਿਕ ਅਧਿਐਨਾਂ 37,38 ਤੋਂ ਇਲਾਵਾ ਵੱਡੇ ਪੱਧਰ 'ਤੇ ਅਣਪਛਾਤੇ ਰਹਿੰਦੇ ਹਨ।ਇਹ ਧਿਆਨ ਦੇਣ ਯੋਗ ਹੈ ਕਿ "ca.Eremiobacterota ਜੀਨਸ ਦਾ ਸਿਰਫ ਇੱਕ ਭੂਮੀ ਵਾਤਾਵਰਣ ਵਿੱਚ ਵਿਸ਼ਲੇਸ਼ਣ ਕੀਤਾ ਗਿਆ ਹੈ ਅਤੇ BGC ਵਿੱਚ ਅਮੀਰ ਕਿਸੇ ਵੀ ਮੈਂਬਰ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਲਈ ਨਹੀਂ ਜਾਣਿਆ ਜਾਂਦਾ ਹੈ।ਇੱਥੇ ਅਸੀਂ ਇੱਕੋ ਸਪੀਸੀਜ਼ (ਨਿਊਕਲੀਓਟਾਈਡ ਪਛਾਣ > 99%) ਦੇ ਅੱਠ MAGs ਦਾ ਪੁਨਰਗਠਨ ਕੀਤਾ ਹੈ 23. ਇਸਲਈ ਅਸੀਂ ਸਪੀਸੀਜ਼ ਦਾ ਨਾਮ "ਕੈਂਡੀਡੇਟਸ ਯੂਡੋਰੇਮਾਈਕ੍ਰੋਬੀਅਮ ਮਲਾਸਪਿਨੀ" ਪ੍ਰਸਤਾਵਿਤ ਕਰਦੇ ਹਾਂ, ਜਿਸਦਾ ਨਾਮ ਨੇਰੀਡ (ਸਮੁੰਦਰੀ ਨਿੰਫ) ਦੇ ਨਾਮ ਤੇ ਰੱਖਿਆ ਗਿਆ ਹੈ, ਜੋ ਕਿ ਯੂਨਾਨੀ ਮਿਥਿਹਾਸ ਅਤੇ ਮੁਹਿੰਮਾਂ ਵਿੱਚ ਇੱਕ ਸੁੰਦਰ ਤੋਹਫ਼ਾ ਹੈ।'ਕਾ.ਫਾਈਲੋਜੈਨੇਟਿਕ ਐਨੋਟੇਸ਼ਨ 13 ਦੇ ਅਨੁਸਾਰ, E. malaspinii ਦਾ ਕ੍ਰਮ ਪੱਧਰ ਤੋਂ ਹੇਠਾਂ ਕੋਈ ਪਹਿਲਾਂ ਜਾਣਿਆ ਜਾਣ ਵਾਲਾ ਰਿਸ਼ਤੇਦਾਰ ਨਹੀਂ ਹੈ ਅਤੇ ਇਸ ਤਰ੍ਹਾਂ ਇੱਕ ਨਵੇਂ ਬੈਕਟੀਰੀਆ ਪਰਿਵਾਰ ਨਾਲ ਸਬੰਧਤ ਹੈ ਜਿਸਨੂੰ ਅਸੀਂ "Ca.E. malaspinii” ਕਿਸਮ ਦੀ ਕਿਸਮ ਅਤੇ “Ca.Eudormicrobiaceae” ਅਧਿਕਾਰਤ ਨਾਮ ਵਜੋਂ (ਪੂਰਕ ਜਾਣਕਾਰੀ)।'Ca ਦਾ ਸੰਖੇਪ ਮੇਟਾਜੇਨੋਮਿਕ ਪੁਨਰ ਨਿਰਮਾਣ।E. malaspinii ਜੀਨੋਮ ਪ੍ਰੋਜੈਕਟ ਨੂੰ 75 kb ਡੁਪਲੀਕੇਸ਼ਨ ਦੇ ਨਾਲ ਇੱਕ ਸਿੰਗਲ 9.63 Mb ਲੀਨੀਅਰ ਕ੍ਰੋਮੋਸੋਮ ਦੇ ਤੌਰ 'ਤੇ ਬਹੁਤ ਘੱਟ ਇਨਪੁਟ, ਲੰਬੇ ਸਮੇਂ ਤੋਂ ਰੀਡ ਮੈਟਾਜੇਨੋਮਿਕ ਕ੍ਰਮ ਅਤੇ ਇੱਕ ਸਿੰਗਲ ਨਮੂਨੇ (ਤਰੀਕਿਆਂ) ਦੀ ਨਿਸ਼ਾਨਾ ਅਸੈਂਬਲੀ ਦੁਆਰਾ ਪ੍ਰਮਾਣਿਤ ਕੀਤਾ ਗਿਆ ਸੀ।ਸਿਰਫ ਬਾਕੀ ਬਚੀ ਅਸਪਸ਼ਟਤਾ ਦੇ ਰੂਪ ਵਿੱਚ.
ਇਸ ਸਪੀਸੀਜ਼ ਦੇ ਫਾਈਲੋਜੈਨੇਟਿਕ ਸੰਦਰਭ ਨੂੰ ਸਥਾਪਿਤ ਕਰਨ ਲਈ, ਅਸੀਂ ਟਾਰਗੇਟ ਜੀਨੋਮ ਪੁਨਰਗਠਨ ਦੁਆਰਾ ਤਾਰਾ ਮਹਾਸਾਗਰ ਮੁਹਿੰਮ ਤੋਂ ਵਾਧੂ ਯੂਕੇਰੀਓਟਿਕ-ਅਨੁਕੂਲਿਤ ਮੈਟਾਜੇਨੋਮਿਕ ਨਮੂਨਿਆਂ ਵਿੱਚ 40 ਨਜ਼ਦੀਕੀ ਸਬੰਧਿਤ ਪ੍ਰਜਾਤੀਆਂ ਦੀ ਖੋਜ ਕੀਤੀ।ਸੰਖੇਪ ਰੂਪ ਵਿੱਚ, ਅਸੀਂ "Ca" ਨਾਲ ਜੁੜੇ ਜੀਨੋਮਿਕ ਟੁਕੜਿਆਂ ਨਾਲ ਮੈਟਾਜੇਨੋਮਿਕ ਰੀਡਸ ਨੂੰ ਜੋੜਿਆ ਹੈ।E. malaspinii” ਅਤੇ ਇਹ ਅਨੁਮਾਨ ਲਗਾਇਆ ਗਿਆ ਕਿ ਇਸ ਨਮੂਨੇ ਵਿੱਚ ਇੱਕ ਵਧੀ ਹੋਈ ਭਰਤੀ ਦਰ ਹੋਰ ਰਿਸ਼ਤੇਦਾਰਾਂ (ਤਰੀਕਿਆਂ) ਦੀ ਮੌਜੂਦਗੀ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ।ਨਤੀਜੇ ਵਜੋਂ, ਅਸੀਂ 10 MAGs ਲੱਭੇ, 19 MAGs ਦਾ ਸੁਮੇਲ ਇੱਕ ਨਵੇਂ ਪਰਿਭਾਸ਼ਿਤ ਪਰਿਵਾਰ (ਜਿਵੇਂ ਕਿ "Ca. Eudormicrobiaceae") ਦੇ ਅੰਦਰ ਤਿੰਨ ਪੀੜ੍ਹੀਆਂ ਵਿੱਚ ਪੰਜ ਪ੍ਰਜਾਤੀਆਂ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ।ਦਸਤੀ ਨਿਰੀਖਣ ਅਤੇ ਗੁਣਵੱਤਾ ਨਿਯੰਤਰਣ (ਵਿਸਤ੍ਰਿਤ ਡੇਟਾ, ਚਿੱਤਰ 6 ਅਤੇ ਵਾਧੂ ਜਾਣਕਾਰੀ) ਤੋਂ ਬਾਅਦ, ਅਸੀਂ ਪਾਇਆ ਕਿ “Ca.Eudormicrobiaceae ਸਪੀਸੀਜ਼ ਹੋਰ "Ca" ਮੈਂਬਰਾਂ ਨਾਲੋਂ ਵੱਡੇ ਜੀਨੋਮ (8 Mb) ਅਤੇ ਅਮੀਰ ਬਾਇਓਸਿੰਥੈਟਿਕ ਸੰਭਾਵੀ (14 ਤੋਂ 22 BGC ਪ੍ਰਤੀ ਸਪੀਸੀਜ਼) ਪੇਸ਼ ਕਰਦੇ ਹਨ।ਕਲੇਡ ਏਰੀਮੀਓਬੈਕਟੀਰੋਟਾ (7 BGC ਤੱਕ) (ਚਿੱਤਰ 3a–c)।
a, ਪੰਜ 'Ca' ਦੀਆਂ ਫਾਈਲੋਜੈਨੇਟਿਕ ਸਥਿਤੀਆਂ।Eudormicrobiaceae ਦੀਆਂ ਕਿਸਮਾਂ ਨੇ ਇਸ ਅਧਿਐਨ ਵਿੱਚ ਪਛਾਣੀਆਂ ਗਈਆਂ ਸਮੁੰਦਰੀ ਲਾਈਨਾਂ ਲਈ ਖਾਸ BGC ਅਮੀਰੀ ਦਿਖਾਈ।ਫਾਈਲੋਜੇਨੇਟਿਕ ਰੁੱਖ ਵਿੱਚ ਸਾਰੇ 'Ca' ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ।MAG Eremiobacterota ਅਤੇ GTDB (ਵਰਜਨ 89) ਵਿੱਚ ਪ੍ਰਦਾਨ ਕੀਤੇ ਗਏ ਹੋਰ ਫਾਈਲਾ (ਬਰੈਕਟਾਂ ਵਿੱਚ ਜੀਨੋਮ ਨੰਬਰ) ਦੇ ਮੈਂਬਰ ਵਿਕਾਸਵਾਦੀ ਪਿਛੋਕੜ (ਤਰੀਕਿਆਂ) ਲਈ ਵਰਤੇ ਗਏ ਸਨ।ਸਭ ਤੋਂ ਬਾਹਰੀ ਪਰਤਾਂ ਪਰਿਵਾਰਕ ਪੱਧਰ ("Ca. Eudormicrobiaceae" ਅਤੇ "Ca. Xenobiaceae") ਅਤੇ ਸ਼੍ਰੇਣੀ ਪੱਧਰ ("Ca. Eremiobacteria") 'ਤੇ ਵਰਗੀਕਰਨ ਨੂੰ ਦਰਸਾਉਂਦੀਆਂ ਹਨ।ਇਸ ਅਧਿਐਨ ਵਿੱਚ ਵਰਣਿਤ ਪੰਜ ਪ੍ਰਜਾਤੀਆਂ ਨੂੰ ਅਲਫਾਨਿਊਮੇਰਿਕ ਕੋਡ ਅਤੇ ਪ੍ਰਸਤਾਵਿਤ ਬਾਇਨੋਮੀਅਲ ਨਾਮ (ਪੂਰਕ ਜਾਣਕਾਰੀ) ਦੁਆਰਾ ਦਰਸਾਇਆ ਗਿਆ ਹੈ।b, ਠੀਕ ਹੈ।Eudormicrobiaceae ਸਪੀਸੀਜ਼ ਸੱਤ ਸਾਂਝੇ BGC ਨਿਊਕਲੀਅਸ ਨੂੰ ਸਾਂਝਾ ਕਰਦੇ ਹਨ।A2 ਕਲੇਡ ਵਿੱਚ BGC ਦੀ ਅਣਹੋਂਦ ਪ੍ਰਤੀਨਿਧੀ MAG (ਪੂਰਕ ਸਾਰਣੀ 3) ਦੀ ਅਧੂਰੀ ਹੋਣ ਕਾਰਨ ਸੀ।BGCs “Ca.ਐਮਫੀਥੋਮਾਈਕ੍ਰੋਬੀਅਮ" ਅਤੇ "Ca.ਐਂਫੀਥੋਮਾਈਕ੍ਰੋਬੀਅਮ” (ਕਲੇਡ ਏ ਅਤੇ ਬੀ) ਨਹੀਂ ਦਿਖਾਏ ਗਏ ਹਨ।c, ਸਾਰੇ BGCs “Ca.Eudoremicrobium taraoceanii ਨੂੰ ਤਾਰਾ ਦੇ ਸਮੁੰਦਰਾਂ ਤੋਂ ਲਏ ਗਏ 623 ਮੈਟਾਟ੍ਰਾਂਸਕ੍ਰਿਪਟਮ ਵਿੱਚ ਪ੍ਰਗਟ ਕੀਤਾ ਗਿਆ ਸੀ।ਠੋਸ ਚੱਕਰ ਸਰਗਰਮ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ।ਔਰੇਂਜ ਸਰਕਲ ਹਾਊਸਕੀਪਿੰਗ ਜੀਨ ਐਕਸਪ੍ਰੈਸ਼ਨ ਰੇਟ (ਤਰੀਕਿਆਂ) ਦੇ ਹੇਠਾਂ ਅਤੇ ਉੱਪਰ ਲੌਗ2-ਪਰਿਵਰਤਿਤ ਫੋਲਡ ਤਬਦੀਲੀਆਂ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ।d, ਸਾਪੇਖਿਕ ਭਰਪੂਰਤਾ ਵਕਰ (ਤਰੀਕਿਆਂ) 'Ca ਦਿਖਾਉਂਦੇ ਹੋਏ।Eudormicrobiaceae ਦੀਆਂ ਕਿਸਮਾਂ ਜ਼ਿਆਦਾਤਰ ਸਮੁੰਦਰੀ ਬੇਸਿਨਾਂ ਅਤੇ ਪੂਰੇ ਪਾਣੀ ਦੇ ਕਾਲਮ (ਸਤਹ ਤੋਂ ਘੱਟੋ ਘੱਟ 4000 ਮੀਟਰ ਦੀ ਡੂੰਘਾਈ ਤੱਕ) ਵਿੱਚ ਵਿਆਪਕ ਹਨ।ਇਹਨਾਂ ਅਨੁਮਾਨਾਂ ਦੇ ਆਧਾਰ 'ਤੇ, ਅਸੀਂ ਪਾਇਆ ਕਿ 'Ca.E. malaspinii' ਡੂੰਘੇ-ਸਮੁੰਦਰੀ ਪੈਲਾਜਿਕ ਅਨਾਜ ਨਾਲ ਜੁੜੇ ਭਾਈਚਾਰਿਆਂ ਵਿੱਚ ਪ੍ਰੋਕੈਰੀਓਟਿਕ ਸੈੱਲਾਂ ਦੇ 6% ਤੱਕ ਦਾ ਯੋਗਦਾਨ ਪਾਉਂਦਾ ਹੈ।ਅਸੀਂ ਕਿਸੇ ਸਪੀਸੀਜ਼ ਨੂੰ ਕਿਸੇ ਸਾਈਟ 'ਤੇ ਮੌਜੂਦ ਮੰਨਿਆ ਜਾਂਦਾ ਹੈ ਜੇਕਰ ਇਹ ਕਿਸੇ ਦਿੱਤੀ ਗਈ ਡੂੰਘਾਈ ਦੀ ਪਰਤ ਦੇ ਆਕਾਰ ਦੇ ਕਿਸੇ ਵੀ ਹਿੱਸੇ ਵਿੱਚ ਪਾਈ ਜਾਂਦੀ ਹੈ।IO - ਹਿੰਦ ਮਹਾਸਾਗਰ, NAO - ਉੱਤਰੀ ਅਟਲਾਂਟਿਕ, NPO - ਉੱਤਰੀ ਪ੍ਰਸ਼ਾਂਤ, RS - ਲਾਲ ਸਾਗਰ, SAO - ਦੱਖਣੀ ਅਟਲਾਂਟਿਕ, SO - ਦੱਖਣੀ ਮਹਾਂਸਾਗਰ, SPO - ਦੱਖਣੀ ਪ੍ਰਸ਼ਾਂਤ।
Ca ਦੀ ਭਰਪੂਰਤਾ ਅਤੇ ਵੰਡ ਦਾ ਅਧਿਐਨ ਕਰਨਾ।Eudormicrobiaceae, ਜਿਵੇਂ ਕਿ ਅਸੀਂ ਪਾਇਆ ਹੈ, ਜ਼ਿਆਦਾਤਰ ਸਮੁੰਦਰੀ ਬੇਸਿਨਾਂ ਦੇ ਨਾਲ-ਨਾਲ ਪੂਰੇ ਪਾਣੀ ਦੇ ਕਾਲਮ (ਚਿੱਤਰ 3d) ਵਿੱਚ ਪ੍ਰਮੁੱਖ ਹੈ।ਸਥਾਨਕ ਤੌਰ 'ਤੇ, ਉਹ ਸਮੁੰਦਰੀ ਮਾਈਕ੍ਰੋਬਾਇਲ ਕਮਿਊਨਿਟੀ ਦਾ 6% ਬਣਾਉਂਦੇ ਹਨ, ਉਨ੍ਹਾਂ ਨੂੰ ਗਲੋਬਲ ਸਮੁੰਦਰੀ ਮਾਈਕ੍ਰੋਬਾਇਓਮ ਦਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਹਿੱਸਾ ਬਣਾਉਂਦੇ ਹਨ।ਇਸ ਤੋਂ ਇਲਾਵਾ, ਸਾਨੂੰ Ca ਦੀ ਸੰਬੰਧਿਤ ਸਮੱਗਰੀ ਮਿਲੀ।Eudormicrobiaceae ਸਪੀਸੀਜ਼ ਅਤੇ ਉਹਨਾਂ ਦੇ BGC ਸਮੀਕਰਨ ਪੱਧਰ ਯੂਕੇਰੀਓਟਿਕ ਐਨਰਿਚਡ ਫਰੈਕਸ਼ਨ (ਚਿੱਤਰ 3c ਅਤੇ ਵਿਸਤ੍ਰਿਤ ਡੇਟਾ, ਚਿੱਤਰ 7) ਵਿੱਚ ਸਭ ਤੋਂ ਉੱਚੇ ਸਨ, ਜੋ ਪਲੈਂਕਟਨ ਸਮੇਤ ਕਣਾਂ ਦੇ ਨਾਲ ਇੱਕ ਸੰਭਾਵੀ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ।ਇਹ ਨਿਰੀਖਣ 'Ca ਨਾਲ ਕੁਝ ਸਮਾਨਤਾ ਰੱਖਦਾ ਹੈ।Eudoremicrobium BGCs ਜੋ ਜਾਣੇ-ਪਛਾਣੇ ਮਾਰਗਾਂ ਰਾਹੀਂ ਸਾਇਟੋਟੌਕਸਿਕ ਕੁਦਰਤੀ ਉਤਪਾਦਾਂ ਦਾ ਉਤਪਾਦਨ ਕਰਦੇ ਹਨ, ਸ਼ਿਕਾਰੀ ਵਿਵਹਾਰ ਨੂੰ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰ ਸਕਦੇ ਹਨ (ਪੂਰਕ ਜਾਣਕਾਰੀ ਅਤੇ ਵਿਸਤ੍ਰਿਤ ਡੇਟਾ, ਚਿੱਤਰ 8), ਦੂਜੇ ਸ਼ਿਕਾਰੀਆਂ ਦੇ ਸਮਾਨ ਜੋ ਖਾਸ ਤੌਰ 'ਤੇ ਮੈਟਾਬੋਲਾਈਟਸ ਜਿਵੇਂ ਕਿ ਮਾਈਕਸੋਕੋਕਸ 41 ਪੈਦਾ ਕਰਦੇ ਹਨ।ਸੀਏ ਦੀ ਖੋਜ.ਪ੍ਰੋਕੈਰੀਓਟਿਕ ਨਮੂਨਿਆਂ ਦੀ ਬਜਾਏ ਘੱਟ ਉਪਲਬਧ (ਡੂੰਘੇ ਸਮੁੰਦਰ) ਜਾਂ ਯੂਕੇਰੀਓਟਿਕ ਵਿੱਚ ਯੂਡੋਰਮਾਈਕ੍ਰੋਬੀਆਸੀਏ ਇਹ ਵਿਆਖਿਆ ਕਰ ਸਕਦੇ ਹਨ ਕਿ ਕੁਦਰਤੀ ਭੋਜਨ ਖੋਜ ਦੇ ਸੰਦਰਭ ਵਿੱਚ ਇਹ ਬੈਕਟੀਰੀਆ ਅਤੇ ਉਹਨਾਂ ਦੀ ਅਚਾਨਕ ਬੀਜੀਸੀ ਵਿਭਿੰਨਤਾ ਅਸਪਸ਼ਟ ਕਿਉਂ ਰਹਿੰਦੀ ਹੈ।
ਅੰਤ ਵਿੱਚ, ਅਸੀਂ ਨਵੇਂ ਮਾਰਗਾਂ, ਐਨਜ਼ਾਈਮਾਂ ਅਤੇ ਕੁਦਰਤੀ ਉਤਪਾਦਾਂ ਦੀ ਖੋਜ ਵਿੱਚ ਸਾਡੇ ਮਾਈਕ੍ਰੋਬਾਇਓਮ-ਅਧਾਰਿਤ ਕੰਮ ਦੇ ਵਾਅਦੇ ਨੂੰ ਪ੍ਰਯੋਗਾਤਮਕ ਤੌਰ 'ਤੇ ਪ੍ਰਮਾਣਿਤ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕੀਤੀ।BGCs ਦੀਆਂ ਵੱਖ-ਵੱਖ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚੋਂ, RiPP ਮਾਰਗ ਨੂੰ ਪਰਿਪੱਕ ਐਨਜ਼ਾਈਮਜ਼ 42 ਦੁਆਰਾ ਕੋਰ ਪੇਪਟਾਇਡ ਦੇ ਵੱਖ-ਵੱਖ ਪੋਸਟ-ਅਨੁਵਾਦਕ ਸੋਧਾਂ ਦੇ ਕਾਰਨ ਇੱਕ ਅਮੀਰ ਰਸਾਇਣਕ ਅਤੇ ਕਾਰਜਸ਼ੀਲ ਵਿਭਿੰਨਤਾ ਨੂੰ ਏਨਕੋਡ ਕਰਨ ਲਈ ਜਾਣਿਆ ਜਾਂਦਾ ਹੈ।ਇਸ ਲਈ ਅਸੀਂ ਦੋ 'ਸੀਏ.Eudoremicrobium' RiPP BGCs (ਅੰਕੜੇ 3b ਅਤੇ 4a-e) ਕਿਸੇ ਵੀ ਜਾਣੇ ਜਾਂਦੇ BGC (\(\bar{d}\)MIBiG ਅਤੇ \(\bar{d}\)0.2 ਤੋਂ ਉੱਪਰ RefSeq) 'ਤੇ ਆਧਾਰਿਤ ਹਨ।
a–c, ਡੂੰਘੇ ਸਮੁੰਦਰੀ Ca ਸਪੀਸੀਜ਼ ਲਈ ਖਾਸ RiPP ਬਾਇਓਸਿੰਥੇਸਿਸ ਦੇ ਇੱਕ ਨਾਵਲ (\(\bar{d}\)RefSeq = 0.29) ਕਲੱਸਟਰ ਦੇ ਇਨ ਵਿਟਰੋ ਹੇਟਰੋਲੋਗਸ ਸਮੀਕਰਨ ਅਤੇ ਇਨ ਵਿਟਰੋ ਐਨਜ਼ਾਈਮੈਟਿਕ ਅਸੈਸ।E. malaspinii' ਨੇ ਡਿਫਾਸਫੋਰੀਲੇਟਿਡ ਉਤਪਾਦਾਂ ਦੇ ਉਤਪਾਦਨ ਦੀ ਅਗਵਾਈ ਕੀਤੀ।c, ਉੱਚ-ਰੈਜ਼ੋਲੂਸ਼ਨ (HR) MS/MS (ਰਸਾਇਣਕ ਢਾਂਚੇ ਵਿੱਚ b ਅਤੇ y ਆਇਨਾਂ ਦੁਆਰਾ ਦਰਸਾਏ ਗਏ ਫ੍ਰੈਗਮੈਂਟੇਸ਼ਨ) ਅਤੇ NMR (ਵਿਸਤ੍ਰਿਤ ਡੇਟਾ, ਚਿੱਤਰ 9) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਪਛਾਣੀਆਂ ਗਈਆਂ ਸੋਧਾਂ।d, ਇਹ ਫਾਸਫੋਰੀਲੇਟਿਡ ਪੇਪਟਾਈਡ ਥਣਧਾਰੀ ਨਿਊਟ੍ਰੋਫਿਲ ਇਲਾਸਟੇਜ ਦੇ ਘੱਟ ਮਾਈਕ੍ਰੋਮੋਲਰ ਰੋਕ ਨੂੰ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਦਾ ਹੈ, ਜੋ ਕਿ ਨਿਯੰਤਰਣ ਪੈਪਟਾਇਡ ਅਤੇ ਡੀਹਾਈਡ੍ਰੇਟਿੰਗ ਪੇਪਟਾਇਡ (ਰਸਾਇਣਕ ਹਟਾਉਣ ਤੋਂ ਪ੍ਰੇਰਿਤ ਡੀਹਾਈਡਰੇਸ਼ਨ) ਵਿੱਚ ਨਹੀਂ ਪਾਇਆ ਜਾਂਦਾ ਹੈ।ਪ੍ਰਯੋਗ ਨੂੰ ਸਮਾਨ ਨਤੀਜਿਆਂ ਨਾਲ ਤਿੰਨ ਵਾਰ ਦੁਹਰਾਇਆ ਗਿਆ।ਉਦਾਹਰਨ ਲਈ, ਪ੍ਰੋਟੀਨ ਬਾਇਓਸਿੰਥੇਸਿਸ ਦੇ ਇੱਕ ਦੂਜੇ ਨਾਵਲ \(\bar{d}\)RefSeq = 0.33) ਕਲੱਸਟਰ ਦੀ ਵਿਭਿੰਨ ਸਮੀਕਰਨ ਚਾਰ ਪਰਿਪੱਕ ਐਨਜ਼ਾਈਮਾਂ ਦੇ ਕੰਮ ਨੂੰ ਸਪੱਸ਼ਟ ਕਰਦੀ ਹੈ ਜੋ 46 ਐਮੀਨੋ ਐਸਿਡ ਕੋਰ ਪੇਪਟਾਇਡ ਨੂੰ ਸੰਸ਼ੋਧਿਤ ਕਰਦੇ ਹਨ।ਰਹਿੰਦ-ਖੂੰਹਦ ਨੂੰ HR-MS/MS, ਆਈਸੋਟੋਪ ਲੇਬਲਿੰਗ, ਅਤੇ NMR ਵਿਸ਼ਲੇਸ਼ਣ (ਪੂਰਕ ਜਾਣਕਾਰੀ) ਦੁਆਰਾ ਅਨੁਮਾਨਿਤ ਸੋਧ ਦੀ ਸਾਈਟ ਦੇ ਅਨੁਸਾਰ ਦਾਗਿਆ ਜਾਂਦਾ ਹੈ।ਡੈਸ਼ਡ ਰੰਗ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਸੋਧ ਦੋ ਰਹਿੰਦ-ਖੂੰਹਦ ਵਿੱਚੋਂ ਕਿਸੇ ਇੱਕ 'ਤੇ ਹੁੰਦੀ ਹੈ।ਚਿੱਤਰ ਇੱਕੋ ਨਿਊਕਲੀਅਸ ਉੱਤੇ ਸਾਰੇ ਪਰਿਪੱਕ ਐਨਜ਼ਾਈਮਾਂ ਦੀ ਗਤੀਵਿਧੀ ਨੂੰ ਦਰਸਾਉਣ ਲਈ ਅਨੇਕ ਵਿਭਿੰਨ ਰਚਨਾਵਾਂ ਦਾ ਸੰਕਲਨ ਹੈ।h, ਬੈਕਬੋਨ ਐਮਾਈਡ N-methylation ਲਈ NMR ਡੇਟਾ ਦਾ ਉਦਾਹਰਨ।ਪੂਰੇ ਨਤੀਜੇ ਅੰਜੀਰ ਵਿੱਚ ਦਿਖਾਏ ਗਏ ਹਨ।ਵਿਸਤ੍ਰਿਤ ਡੇਟਾ ਦੇ ਨਾਲ 10.i, MIBiG 2.0 ਡੇਟਾਬੇਸ ਵਿੱਚ ਪਾਏ ਗਏ ਸਾਰੇ FkbM ਡੋਮੇਨਾਂ ਵਿੱਚ ਪਰਿਪੱਕ FkbM ਪ੍ਰੋਟੀਨ ਕਲੱਸਟਰ ਐਂਜ਼ਾਈਮ ਦੀ ਫਾਈਲੋਜੈਨੇਟਿਕ ਸਥਿਤੀ N-methyltransferase ਗਤੀਵਿਧੀ (ਪੂਰਕ ਜਾਣਕਾਰੀ) ਵਾਲੇ ਇਸ ਪਰਿਵਾਰ ਦੇ ਇੱਕ ਐਨਜ਼ਾਈਮ ਨੂੰ ਪ੍ਰਗਟ ਕਰਦੀ ਹੈ।BGCs (a, e), ਪਰੀਸਰਸਰ ਪੇਪਟਾਇਡ ਬਣਤਰ (b, f), ਅਤੇ ਕੁਦਰਤੀ ਉਤਪਾਦਾਂ (c, g) ਦੇ ਪੁਟੈਟਿਵ ਰਸਾਇਣਕ ਢਾਂਚੇ ਦੇ ਯੋਜਨਾਬੱਧ ਚਿੱਤਰ ਦਿਖਾਏ ਗਏ ਹਨ।
ਪਹਿਲਾ RiPP ਮਾਰਗ (\(\bar{d}\)MIBiG = 0.41, \(\bar{d}\)RefSeq = 0.29) ਸਿਰਫ਼ ਡੂੰਘੇ ਸਮੁੰਦਰੀ ਸਪੀਸੀਜ਼ “Ca.E. malaspinii” ਅਤੇ ਪੇਪਟਾਇਡ- ਪੂਰਵ-ਸੂਚਕ ਲਈ ਕੋਡ (ਚਿੱਤਰ 4a, b)।ਇਸ ਪਰਿਪੱਕ ਐਨਜ਼ਾਈਮ ਵਿੱਚ, ਅਸੀਂ ਲੈਂਟੀਪੇਪਟਾਇਡ ਸਿੰਥੇਜ਼ ਦੇ ਡੀਹਾਈਡਰੇਸ਼ਨ ਡੋਮੇਨ ਲਈ ਇੱਕ ਸਿੰਗਲ ਫੰਕਸ਼ਨਲ ਡੋਮੇਨ ਸਮਰੂਪ ਦੀ ਪਛਾਣ ਕੀਤੀ ਹੈ ਜੋ ਆਮ ਤੌਰ 'ਤੇ ਫਾਸਫੋਰੀਲੇਸ਼ਨ ਅਤੇ 43 (ਪੂਰਕ ਜਾਣਕਾਰੀ) ਦੇ ਬਾਅਦ ਵਿੱਚ ਹਟਾਉਣ ਨੂੰ ਉਤਪ੍ਰੇਰਿਤ ਕਰਦਾ ਹੈ।ਇਸ ਲਈ, ਅਸੀਂ ਭਵਿੱਖਬਾਣੀ ਕਰਦੇ ਹਾਂ ਕਿ ਪੂਰਵ-ਪੱਧਰੀ ਪੇਪਟਾਇਡ ਦੀ ਸੋਧ ਵਿੱਚ ਅਜਿਹੇ ਦੋ-ਪੜਾਅ ਵਾਲੇ ਡੀਹਾਈਡਰੇਸ਼ਨ ਸ਼ਾਮਲ ਹਨ।ਹਾਲਾਂਕਿ, ਟੈਂਡਮ ਮਾਸ ਸਪੈਕਟ੍ਰੋਮੈਟਰੀ (MS/MS) ਅਤੇ ਨਿਊਕਲੀਅਰ ਮੈਗਨੈਟਿਕ ਰੈਜ਼ੋਨੈਂਸ ਸਪੈਕਟਰੋਸਕੋਪੀ (NMR) ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਅਸੀਂ ਇੱਕ ਪੌਲੀਫੋਸਫੋਰੀਲੇਟਿਡ ਲੀਨੀਅਰ ਪੇਪਟਾਇਡ (ਚਿੱਤਰ 4c) ਦੀ ਪਛਾਣ ਕੀਤੀ।ਹਾਲਾਂਕਿ ਅਚਾਨਕ, ਸਾਨੂੰ ਇਸਦੇ ਅੰਤਮ ਉਤਪਾਦ ਹੋਣ ਦਾ ਸਮਰਥਨ ਕਰਨ ਲਈ ਸਬੂਤ ਦੀਆਂ ਕਈ ਲਾਈਨਾਂ ਮਿਲੀਆਂ: ਦੋ ਵੱਖ-ਵੱਖ ਹੇਟਰੋਲੋਗਸ ਹੋਸਟ ਅਤੇ ਇਨ ਵਿਟਰੋ ਅਸੇਸ ਵਿੱਚ ਕੋਈ ਡੀਹਾਈਡਰੇਸ਼ਨ ਨਹੀਂ, ਪਰਿਪੱਕ ਐਨਜ਼ਾਈਮ ਦੇ ਉਤਪ੍ਰੇਰਕ ਡੀਹਾਈਡਰੇਸ਼ਨ ਸਾਈਟ ਵਿੱਚ ਪਰਿਵਰਤਿਤ ਮੁੱਖ ਅਵਸ਼ੇਸ਼ਾਂ ਦੀ ਪਛਾਣ।ਸਭ ਨੂੰ "Ca" ਦੁਆਰਾ ਪੁਨਰਗਠਿਤ ਕੀਤਾ ਗਿਆ ਹੈ।E. malaspinii ਜੀਨੋਮ (ਵਿਸਤ੍ਰਿਤ ਡੇਟਾ, ਚਿੱਤਰ 9 ਅਤੇ ਅਤਿਰਿਕਤ ਜਾਣਕਾਰੀ) ਅਤੇ, ਅੰਤ ਵਿੱਚ, ਫਾਸਫੋਰੀਲੇਟਡ ਉਤਪਾਦ ਦੀ ਜੀਵ-ਵਿਗਿਆਨਕ ਗਤੀਵਿਧੀ, ਪਰ ਰਸਾਇਣਕ ਤੌਰ 'ਤੇ ਸਿੰਥੇਸਾਈਜ਼ਡ ਡੀਹਾਈਡ੍ਰੇਟਿਡ ਫਾਰਮ (ਚਿੱਤਰ 4d) ਨਹੀਂ।ਵਾਸਤਵ ਵਿੱਚ, ਅਸੀਂ ਪਾਇਆ ਹੈ ਕਿ ਇਹ ਨਿਊਟ੍ਰੋਫਿਲ ਇਲਾਸਟੇਜ ਦੇ ਵਿਰੁੱਧ ਇੱਕ ਘੱਟ ਮਾਈਕ੍ਰੋਮੋਲਰ ਪ੍ਰੋਟੀਜ਼ ਇਨਿਹਿਬਟਰੀ ਗਤੀਵਿਧੀ ਨੂੰ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਦਾ ਹੈ, ਜੋ ਕਿ ਸੰਘਣਤਾ ਰੇਂਜ (IC50 = 14.3 μM) 44 ਵਿੱਚ ਹੋਰ ਸੰਬੰਧਿਤ ਕੁਦਰਤੀ ਉਤਪਾਦਾਂ ਦੇ ਮੁਕਾਬਲੇ ਤੁਲਨਾਤਮਕ ਹੈ, ਇਸ ਤੱਥ ਦੇ ਬਾਵਜੂਦ ਕਿ ਵਾਤਾਵਰਣ ਸੰਬੰਧੀ ਭੂਮਿਕਾ ਨੂੰ ਸਪੱਸ਼ਟ ਕਰਨਾ ਬਾਕੀ ਹੈ।ਇਹਨਾਂ ਨਤੀਜਿਆਂ ਦੇ ਅਧਾਰ ਤੇ, ਅਸੀਂ ਮਾਰਗ ਨੂੰ "ਫਾਸਫੇਪਟਿਨ" ਨਾਮ ਦੇਣ ਦਾ ਪ੍ਰਸਤਾਵ ਕਰਦੇ ਹਾਂ।
ਦੂਜਾ ਕੇਸ 'Ca' ਲਈ ਖਾਸ ਇੱਕ ਗੁੰਝਲਦਾਰ RiPP ਮਾਰਗ ਹੈ।ਜੀਨਸ Eudoremicrobium (\(\bar{d}\)MIBiG = 0.46, \(\bar{d}\)RefSeq = 0.33) ਕੁਦਰਤੀ ਪ੍ਰੋਟੀਨ ਉਤਪਾਦਾਂ (ਚਿੱਤਰ 4e) ਨੂੰ ਏਨਕੋਡ ਕਰਨ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕੀਤੀ ਗਈ ਸੀ।ਮੁਕਾਬਲਤਨ ਛੋਟੇ BGCs45 ਦੁਆਰਾ ਏਨਕੋਡ ਕੀਤੇ ਐਨਜ਼ਾਈਮਾਂ ਦੁਆਰਾ ਸਥਾਪਿਤ ਕੀਤੇ ਗਏ ਅਸਾਧਾਰਨ ਰਸਾਇਣਕ ਸੋਧਾਂ ਦੀ ਸੰਭਾਵਿਤ ਘਣਤਾ ਅਤੇ ਕਈ ਕਿਸਮਾਂ ਦੇ ਕਾਰਨ ਇਹ ਮਾਰਗ ਖਾਸ ਬਾਇਓਟੈਕਨੋਲੋਜੀਕਲ ਦਿਲਚਸਪੀ ਦੇ ਹਨ।ਅਸੀਂ ਪਾਇਆ ਕਿ ਇਹ ਪ੍ਰੋਟੀਨ ਪਹਿਲਾਂ ਵਿਸ਼ੇਸ਼ਤਾ ਵਾਲੇ ਪ੍ਰੋਟੀਨਾਂ ਤੋਂ ਵੱਖਰਾ ਹੈ ਕਿਉਂਕਿ ਇਸ ਵਿੱਚ ਪੋਲੀਸੈਰਾਮਾਈਡਜ਼ ਦੇ ਮੁੱਖ NX5N ਮੋਟਿਫ਼ ਅਤੇ ਲੈਂਡੋਰਨਾਮਾਈਡਜ਼ 46 ਦੇ ਲੈਂਥੀਓਨਾਈਨ ਲੂਪ ਦੋਵਾਂ ਦੀ ਘਾਟ ਹੈ।ਆਮ ਵਿਪਰੀਤ ਸਮੀਕਰਨ ਪੈਟਰਨਾਂ ਦੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਦੂਰ ਕਰਨ ਲਈ, ਅਸੀਂ ਉਹਨਾਂ ਨੂੰ ਚਾਰ ਪਰਿਪੱਕ ਪਾਥਵੇਅ ਐਂਜ਼ਾਈਮਾਂ (ਤਰੀਕਿਆਂ) ਨੂੰ ਦਰਸਾਉਣ ਲਈ ਇੱਕ ਕਸਟਮ ਮਾਈਕ੍ਰੋਵਿਰਗੁਲਾ ਐਰੋਡੇਨਿਟ੍ਰੀਫਿਕਸ ਸਿਸਟਮ ਦੇ ਨਾਲ ਵਰਤਿਆ।MS/MS, ਆਈਸੋਟੋਪ ਲੇਬਲਿੰਗ, ਅਤੇ NMR ਦੇ ਸੁਮੇਲ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਅਸੀਂ ਪੇਪਟਾਇਡ ਦੇ 46-ਅਮੀਨੋ ਐਸਿਡ ਕੋਰ ਵਿੱਚ ਇਹਨਾਂ ਪਰਿਪੱਕ ਐਨਜ਼ਾਈਮਾਂ ਦਾ ਪਤਾ ਲਗਾਇਆ (Fig. 4f,g, ਵਿਸਤ੍ਰਿਤ ਡੇਟਾ, ਚਿੱਤਰ 10-12 ਅਤੇ ਵਾਧੂ ਜਾਣਕਾਰੀ)।ਪਰਿਪੱਕ ਐਨਜ਼ਾਈਮਾਂ ਵਿੱਚ, ਅਸੀਂ RiPP ਪਾਥਵੇਅ ਵਿੱਚ ਇੱਕ FkbM O-methyltransferase ਪਰਿਵਾਰਕ ਮੈਂਬਰ 47 ਦੀ ਪਹਿਲੀ ਦਿੱਖ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਾਂ ਅਤੇ ਅਚਾਨਕ ਪਾਇਆ ਕਿ ਇਹ ਪਰਿਪੱਕ ਐਨਜ਼ਾਈਮ ਬੈਕਬੋਨ N-methylation (Fig. 4h, i ਅਤੇ ਵਾਧੂ ਜਾਣਕਾਰੀ) ਨੂੰ ਪੇਸ਼ ਕਰਦਾ ਹੈ।ਹਾਲਾਂਕਿ ਇਹ ਸੋਧ ਕੁਦਰਤੀ NRP48 ਉਤਪਾਦਾਂ ਵਿੱਚ ਜਾਣੀ ਜਾਂਦੀ ਹੈ, ਐਮਾਈਡ ਬਾਂਡਾਂ ਦਾ ਐਨਜ਼ਾਈਮੈਟਿਕ ਐਨ-ਮਿਥਾਈਲੇਸ਼ਨ ਇੱਕ ਗੁੰਝਲਦਾਰ ਪਰ ਬਾਇਓਟੈਕਨਾਲੌਜੀ ਤੌਰ 'ਤੇ ਮਹੱਤਵਪੂਰਨ ਪ੍ਰਤੀਕ੍ਰਿਆ 49 ਹੈ ਜੋ ਹੁਣ ਤੱਕ ਬੋਰੋਸਿਨ ਦੇ RiPP ਪਰਿਵਾਰ ਲਈ ਦਿਲਚਸਪੀ ਦਾ ਵਿਸ਼ਾ ਰਿਹਾ ਹੈ।ਵਿਸ਼ੇਸ਼ਤਾ 50,51.ਐਨਜ਼ਾਈਮਾਂ ਅਤੇ RiPP ਦੇ ਦੂਜੇ ਪਰਿਵਾਰਾਂ ਵਿੱਚ ਇਸ ਗਤੀਵਿਧੀ ਦੀ ਪਛਾਣ ਨਵੇਂ ਕਾਰਜਾਂ ਨੂੰ ਖੋਲ੍ਹ ਸਕਦੀ ਹੈ ਅਤੇ ਪ੍ਰੋਟੀਨ 52 ਦੀ ਕਾਰਜਸ਼ੀਲ ਵਿਭਿੰਨਤਾ ਅਤੇ ਉਹਨਾਂ ਦੀ ਰਸਾਇਣਕ ਵਿਭਿੰਨਤਾ ਨੂੰ ਵਧਾ ਸਕਦੀ ਹੈ।ਪਛਾਣੀਆਂ ਗਈਆਂ ਸੋਧਾਂ ਅਤੇ ਪ੍ਰਸਤਾਵਿਤ ਉਤਪਾਦ ਬਣਤਰ ਦੀ ਅਸਾਧਾਰਨ ਲੰਬਾਈ ਦੇ ਆਧਾਰ 'ਤੇ, ਅਸੀਂ ਇੱਕ ਮਾਰਗ ਦਾ ਨਾਮ "ਪਾਇਥੋਨਾਮਾਈਡ" ਪ੍ਰਸਤਾਵਿਤ ਕਰਦੇ ਹਾਂ।
ਐਨਜ਼ਾਈਮਾਂ ਦੇ ਇੱਕ ਕਾਰਜਸ਼ੀਲ ਵਿਸ਼ੇਸ਼ਤਾ ਵਾਲੇ ਪਰਿਵਾਰ ਵਿੱਚ ਇੱਕ ਅਚਾਨਕ ਐਨਜ਼ਾਈਮੋਲੋਜੀ ਦੀ ਖੋਜ ਨਵੀਆਂ ਖੋਜਾਂ ਲਈ ਵਾਤਾਵਰਣਕ ਜੀਨੋਮਿਕਸ ਦੇ ਵਾਅਦੇ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ, ਅਤੇ ਇਕੱਲੇ ਕ੍ਰਮ ਸਮਰੂਪਤਾ ਦੇ ਅਧਾਰ ਤੇ ਕਾਰਜਸ਼ੀਲ ਅਨੁਮਾਨ ਲਈ ਸੀਮਤ ਸਮਰੱਥਾ ਨੂੰ ਵੀ ਦਰਸਾਉਂਦੀ ਹੈ।ਇਸ ਤਰ੍ਹਾਂ, ਗੈਰ-ਕੈਨੋਨੀਕਲ ਬਾਇਓਐਕਟਿਵ ਪੌਲੀਫੋਸਫੋਰੀਲੇਟਿਡ RiPPs ਦੀਆਂ ਰਿਪੋਰਟਾਂ ਦੇ ਨਾਲ, ਸਾਡੇ ਨਤੀਜੇ ਬਾਇਓਕੈਮੀਕਲ ਮਿਸ਼ਰਣਾਂ ਦੀ ਕਾਰਜਸ਼ੀਲ ਅਮੀਰੀ, ਵਿਭਿੰਨਤਾ ਅਤੇ ਅਸਾਧਾਰਨ ਬਣਤਰਾਂ ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਬੇਪਰਦ ਕਰਨ ਲਈ ਸਿੰਥੈਟਿਕ ਬਾਇਓਲੋਜੀ ਯਤਨਾਂ ਲਈ ਸੰਸਾਧਨ-ਗੰਭੀਰ ਪਰ ਮਹੱਤਵਪੂਰਨ ਮੁੱਲ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦੇ ਹਨ।
ਇੱਥੇ ਅਸੀਂ ਵਿਗਿਆਨਕ ਭਾਈਚਾਰੇ (https://microbiomics.io/ocean/) ਲਈ ਨਤੀਜੇ ਵਜੋਂ ਸਰੋਤ ਉਪਲਬਧ ਕਰਵਾ ਕੇ ਭਵਿੱਖੀ ਖੋਜ ਦੀ ਸਹੂਲਤ ਦਿੰਦੇ ਹੋਏ, ਗਲੋਬਲ ਸਮੁੰਦਰੀ ਮਾਈਕ੍ਰੋਬਾਇਓਮ ਵਿੱਚ ਰੋਗਾਣੂਆਂ ਦੁਆਰਾ ਏਨਕੋਡ ਕੀਤੇ ਬਾਇਓਸਿੰਥੈਟਿਕ ਸੰਭਾਵੀ ਅਤੇ ਉਹਨਾਂ ਦੇ ਜੀਨੋਮਿਕ ਸੰਦਰਭ ਦੀ ਰੇਂਜ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦੇ ਹਾਂ।ਅਸੀਂ ਪਾਇਆ ਕਿ ਇਸਦੀ ਜ਼ਿਆਦਾਤਰ ਫਾਈਲੋਜੈਨੇਟਿਕ ਅਤੇ ਕਾਰਜਸ਼ੀਲ ਨਵੀਨਤਾ ਸਿਰਫ MAGs ਅਤੇ SAGs ਦੇ ਪੁਨਰਗਠਨ ਦੁਆਰਾ ਪ੍ਰਾਪਤ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ, ਖਾਸ ਤੌਰ 'ਤੇ ਘੱਟ ਵਰਤੋਂ ਵਾਲੇ ਮਾਈਕ੍ਰੋਬਾਇਲ ਕਮਿਊਨਿਟੀਆਂ ਵਿੱਚ ਜੋ ਭਵਿੱਖ ਦੇ ਬਾਇਓਪ੍ਰਸਪੈਕਟਿੰਗ ਯਤਨਾਂ ਦੀ ਅਗਵਾਈ ਕਰ ਸਕਦੇ ਹਨ।ਹਾਲਾਂਕਿ ਅਸੀਂ ਇੱਥੇ 'ਸੀਏ' 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਤ ਕਰਾਂਗੇ.Eudormicrobiaceae” ਇੱਕ ਵੰਸ਼ ਦੇ ਰੂਪ ਵਿੱਚ ਖਾਸ ਤੌਰ 'ਤੇ ਬਾਇਓਸਿੰਥੈਟਿਕ ਤੌਰ 'ਤੇ "ਪ੍ਰਤਿਭਾਸ਼ਾਲੀ", ਅਣਪਛਾਤੇ ਮਾਈਕ੍ਰੋਬਾਇਓਟਾ ਵਿੱਚ ਪੂਰਵ-ਅਨੁਮਾਨਿਤ ਕੀਤੇ ਗਏ ਬਹੁਤ ਸਾਰੇ BGC ਸੰਭਾਵਤ ਤੌਰ 'ਤੇ ਪਹਿਲਾਂ ਅਣਵਰਣਿਤ ਐਨਜ਼ਾਈਮੋਲੋਜੀਜ਼ ਨੂੰ ਏਨਕੋਡ ਕਰਦੇ ਹਨ ਜੋ ਵਾਤਾਵਰਣ ਅਤੇ/ਜਾਂ ਬਾਇਓਟੈਕਨਾਲੋਜੀ ਤੌਰ 'ਤੇ ਮਹੱਤਵਪੂਰਨ ਕਿਰਿਆਵਾਂ ਦੇ ਨਾਲ ਮਿਸ਼ਰਣ ਪੈਦਾ ਕਰਦੇ ਹਨ।
ਸਮੁੰਦਰੀ ਬੇਸਿਨਾਂ, ਡੂੰਘੀਆਂ ਪਰਤਾਂ ਅਤੇ ਸਮੇਂ ਦੇ ਨਾਲ ਗਲੋਬਲ ਸਮੁੰਦਰੀ ਮਾਈਕ੍ਰੋਬਾਇਲ ਕਮਿਊਨਿਟੀਆਂ ਦੀ ਕਵਰੇਜ ਨੂੰ ਵੱਧ ਤੋਂ ਵੱਧ ਕਰਨ ਲਈ ਕਾਫ਼ੀ ਕ੍ਰਮ ਡੂੰਘਾਈ ਦੇ ਨਾਲ ਪ੍ਰਮੁੱਖ ਸਮੁੰਦਰੀ ਵਿਗਿਆਨ ਅਤੇ ਸਮਾਂ ਲੜੀ ਦੇ ਅਧਿਐਨਾਂ ਤੋਂ ਮੈਟਾਜੇਨੋਮਿਕ ਡੇਟਾਸੈਟਾਂ ਨੂੰ ਸ਼ਾਮਲ ਕੀਤਾ ਗਿਆ ਸੀ।ਇਹਨਾਂ ਡੇਟਾਸੈਟਾਂ (ਪੂਰਕ ਸਾਰਣੀ 1 ਅਤੇ ਚਿੱਤਰ 1) ਵਿੱਚ ਤਾਰਾ ਦੇ ਸਮੁੰਦਰਾਂ ਵਿੱਚ ਇਕੱਤਰ ਕੀਤੇ ਗਏ ਨਮੂਨਿਆਂ ਤੋਂ ਮੈਟਾਜੇਨੋਮਿਕਸ ਸ਼ਾਮਲ ਹਨ (ਵਾਇਰਲ ਇਨਰਿਚਡ, n = 190; ਪ੍ਰੋਕੈਰੀਓਟਿਕ ਐਨਰਿਚਡ, n = 180) 12,22 ਅਤੇ ਬਾਇਓਜੀਓਟ੍ਰੈਸੀਸ ਮੁਹਿੰਮ (n = 480)।ਹਵਾਈਅਨ ਓਸ਼ੀਅਨ ਟਾਈਮ ਸੀਰੀਜ਼ (HOT, n = 68), ਬਰਮੂਡਾ-ਐਟਲਾਂਟਿਕ ਟਾਈਮ ਸੀਰੀਜ਼ (BATS, n = 62)21 ਅਤੇ ਮਾਲਸਪੀਨਾ ਐਕਸਪੀਡੀਸ਼ਨ (n = 58)23।ਰੀਡਜ਼ ਤੋਂ ਸੀਕੁਐਂਸਿੰਗ ਅਡੈਪਟਰਾਂ ਨੂੰ ਹਟਾ ਕੇ, ਗੁਣਵੱਤਾ ਨਿਯੰਤਰਣ ਕ੍ਰਮਾਂ (PhiX ਜੀਨੋਮਜ਼) ਨਾਲ ਮੈਪ ਕੀਤੇ ਰੀਡਜ਼ ਨੂੰ ਹਟਾ ਕੇ, ਅਤੇ trimq=14, maq=20 ਦੀ ਵਰਤੋਂ ਕਰਕੇ, BBMap (v.38.71) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਗੁਣਵੱਤਾ ਲਈ ਸਾਰੇ ਮੈਟੇਜਨੋਮਿਕ ਟੁਕੜਿਆਂ ਤੋਂ ਕ੍ਰਮਵਾਰ ਰੀਡ ਫਿਲਟਰ ਕੀਤੇ ਗਏ ਸਨ, ਮਾਕ = 20 ਪੜ੍ਹਣ ਦੀ ਗੁਣਵੱਤਾ ਨੂੰ ਰੱਦ ਕਰਦੇ ਹਨ। maxns = 0 ਅਤੇ ਘੱਟੋ-ਘੱਟ ਲੰਬਾਈ = 45. ਬਾਅਦ ਦੇ ਵਿਸ਼ਲੇਸ਼ਣ ਚਲਾਏ ਗਏ ਸਨ ਜਾਂ QC ਰੀਡਜ਼ ਨਾਲ ਮਿਲਾ ਦਿੱਤੇ ਗਏ ਸਨ ਜੇਕਰ ਨਿਰਧਾਰਤ ਕੀਤਾ ਗਿਆ ਹੈ (bbmerge.sh minoverlap=16)।MetaSPAdes (v.3.11.1 ਜਾਂ v.3.12 ਜੇ ਲੋੜ ਹੋਵੇ) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਬਣਾਉਣ ਤੋਂ ਪਹਿਲਾਂ QC ਰੀਡਿੰਗਾਂ ਨੂੰ ਆਮ ਬਣਾਇਆ ਗਿਆ ਸੀ (bbnorm.sh ਟਾਰਗਿਟ = 40, ਦਿਮਾਗ ਦੀ ਗਹਿਰਾਈ = 0) 53।ਨਤੀਜੇ ਵਜੋਂ ਸਕੈਫੋਲਡ ਕੰਟੀਗਸ (ਇਸ ਤੋਂ ਬਾਅਦ ਸਕੈਫੋਲਡਜ਼ ਵਜੋਂ ਜਾਣਿਆ ਜਾਂਦਾ ਹੈ) ਅੰਤ ਵਿੱਚ ਲੰਬਾਈ (≥1 kb) ਦੁਆਰਾ ਫਿਲਟਰ ਕੀਤੇ ਗਏ ਸਨ।
1038 ਮੈਟਾਜੇਨੋਮਿਕ ਨਮੂਨਿਆਂ ਨੂੰ ਸਮੂਹਾਂ ਵਿੱਚ ਵੰਡਿਆ ਗਿਆ ਸੀ, ਅਤੇ ਨਮੂਨਿਆਂ ਦੇ ਹਰੇਕ ਸਮੂਹ ਲਈ, ਸਾਰੇ ਨਮੂਨਿਆਂ ਦੇ ਮੈਟਾਜੇਨੋਮਿਕ ਗੁਣਵੱਤਾ ਨਿਯੰਤਰਣ ਰੀਡ ਨੂੰ ਹਰੇਕ ਨਮੂਨੇ ਦੇ ਬਰੈਕਟਾਂ ਨਾਲ ਵੱਖਰੇ ਤੌਰ 'ਤੇ ਮੇਲਿਆ ਗਿਆ ਸੀ, ਜਿਸ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਹੇਠਾਂ ਦਿੱਤੇ ਜੋੜੀ ਵਾਲੇ ਬ੍ਰੈਕੇਟ ਵਾਲੇ ਸਮੂਹ ਪੜ੍ਹੇ ਗਏ ਹਨ: ਤਾਰਾ ਸਮੁੰਦਰੀ ਵਾਇਰਸ - ਸੰਪੂਰਨ (190×190), ਪ੍ਰੋਕੈਰੀਓਟਸ ਐਨਰਿਚਡ (180×180), ਬਾਇਓਜੀਓਟਰੇਸ, ਹੌਟ ਅਤੇ ਬੈਟਸ (610×610) ਅਤੇ ਮਾਲਾਸਪੀਨਾ (58×58)।ਮੈਪਿੰਗ ਬਰੋਜ਼-ਵ੍ਹੀਲਰ-ਅਲਾਈਨਰ (BWA) (v.0.7.17-r1188)54 ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਕੀਤੀ ਗਈ ਸੀ ਜੋ ਰੀਡਿੰਗ ਨੂੰ ਸੈਕੰਡਰੀ ਸਾਈਟਾਂ (-a ਫਲੈਗ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ) ਨਾਲ ਮੇਲ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ।ਅਲਾਈਨਮੈਂਟਾਂ ਨੂੰ ਘੱਟੋ-ਘੱਟ 45 ਬੇਸ ਲੰਬੇ ਹੋਣ ਲਈ ਫਿਲਟਰ ਕੀਤਾ ਗਿਆ ਸੀ, ਉਹਨਾਂ ਦੀ ≥97% ਪਛਾਣ ਹੈ, ਅਤੇ ਸਪੈਨ ≥80% ਰੀਡਜ਼ ਹੈ।ਨਤੀਜੇ ਵਜੋਂ BAM ਫਾਈਲਾਂ ਨੂੰ ਹਰੇਕ ਸਮੂਹ ਲਈ ਅੰਤਰ- ਅਤੇ ਅੰਤਰ-ਨਮੂਨਾ ਕਵਰੇਜ ਪ੍ਰਦਾਨ ਕਰਨ ਲਈ MetaBAT2 (v.2.12.1)55 ਲਈ jgi_summarize_bam_contig_depths ਸਕ੍ਰਿਪਟ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਪ੍ਰਕਿਰਿਆ ਕੀਤੀ ਗਈ ਸੀ।ਅੰਤ ਵਿੱਚ, ਬਰੈਕਟਾਂ ਨੂੰ -minContig 2000 ਅਤੇ -maxEdges 500 ਦੇ ਨਾਲ ਸਾਰੇ ਨਮੂਨਿਆਂ 'ਤੇ ਵਿਅਕਤੀਗਤ ਤੌਰ 'ਤੇ MetaBAT2 ਚਲਾ ਕੇ ਸੰਵੇਦਨਸ਼ੀਲਤਾ ਨੂੰ ਵਧਾਉਣ ਲਈ ਸਮੂਹ ਕੀਤਾ ਗਿਆ ਸੀ। ਅਸੀਂ ਇੱਕ ensemble ਮੁੱਕੇਬਾਜ਼ ਦੀ ਬਜਾਏ MetaBAT2 ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਾਂ ਕਿਉਂਕਿ ਇਹ ਸੁਤੰਤਰ ਟੈਸਟਾਂ ਵਿੱਚ ਸਭ ਤੋਂ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਸਿੰਗਲ ਮੁੱਕੇਬਾਜ਼ ਵਜੋਂ ਦਿਖਾਇਆ ਗਿਆ ਹੈ।ਅਤੇ ਹੋਰ ਆਮ ਤੌਰ 'ਤੇ ਵਰਤੇ ਜਾਣ ਵਾਲੇ ਮੁੱਕੇਬਾਜ਼ਾਂ ਨਾਲੋਂ 10 ਤੋਂ 50 ਗੁਣਾ ਤੇਜ਼ 57।ਭਰਪੂਰਤਾ ਸਬੰਧਾਂ ਦੇ ਪ੍ਰਭਾਵ ਦੀ ਜਾਂਚ ਕਰਨ ਲਈ, ਮੈਟਾਜੇਨੋਮਿਕਸ ਦੇ ਇੱਕ ਬੇਤਰਤੀਬੇ ਤੌਰ 'ਤੇ ਚੁਣੇ ਗਏ ਉਪ-ਨਮੂਨੇ (ਦੋ ਤਾਰਾ ਮਹਾਂਸਾਗਰ ਡੇਟਾਸੈਟਾਂ ਵਿੱਚੋਂ ਹਰੇਕ ਲਈ 10, ਬਾਇਓਜੀਓਟ੍ਰੇਸ ਲਈ 10, ਹਰ ਵਾਰ ਲੜੀ ਲਈ 5, ਅਤੇ ਮਾਲਾਸਪੀਨਾ ਲਈ 5) ਸਿਰਫ਼ ਨਮੂਨੇ ਵਰਤੇ ਗਏ ਹਨ।ਅੰਦਰੂਨੀ ਨਮੂਨਿਆਂ ਨੂੰ ਕਵਰੇਜ ਦੀ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਸਮੂਹਬੱਧ ਕੀਤਾ ਗਿਆ ਹੈ।(ਵਧੀਕ ਜਾਣਕਾਰੀ).
ਬਾਅਦ ਦੇ ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਵਾਧੂ (ਬਾਹਰੀ) ਜੀਨੋਮ ਸ਼ਾਮਲ ਕੀਤੇ ਗਏ ਸਨ, ਅਰਥਾਤ Tara Oceans26 ਡੇਟਾਸੈਟ ਦੇ ਇੱਕ ਸਬਸੈੱਟ ਤੋਂ 830 ਮੈਨੁਅਲ ਚੁਣੇ ਗਏ MAGs, GORG20 ਡੇਟਾਸੈਟ ਤੋਂ 5287 SAGs, ਅਤੇ MAR ਡੇਟਾਬੇਸ (MarDB v. 4) ਤੋਂ ਡੇਟਾ 1707 REFsol ਅਤੇ ਹੈ। 682 SAGs) 27. MarDB ਡੇਟਾਸੈਟ ਲਈ, ਜੇ ਨਮੂਨਾ ਦੀ ਕਿਸਮ ਨਿਮਨਲਿਖਤ ਰੈਗੂਲਰ ਸਮੀਕਰਨ ਨਾਲ ਮੇਲ ਖਾਂਦੀ ਹੈ ਤਾਂ ਉਪਲਬਧ ਮੈਟਾਡੇਟਾ ਦੇ ਆਧਾਰ 'ਤੇ ਜੀਨੋਮ ਚੁਣੇ ਜਾਂਦੇ ਹਨ: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] ਅਲੱਗ-ਥਲੱਗ'।
ਹਰੇਕ ਮੈਟਾਜੇਨੋਮਿਕ ਕੰਟੇਨਰ ਅਤੇ ਬਾਹਰੀ ਜੀਨੋਮ ਦੀ ਗੁਣਵੱਤਾ ਦਾ ਮੁਲਾਂਕਣ CheckM (v.1.0.13) ਅਤੇ Anvi'o's Lineage Workflow (v.5.5.0)58,59 ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਕੀਤਾ ਗਿਆ ਸੀ।ਜੇਕਰ CheckM ਜਾਂ Anvi'o ≥50% ਸੰਪੂਰਨਤਾ/ਸੰਪੂਰਨਤਾ ਅਤੇ ≤10% ਗੰਦਗੀ/ਰਿਡੰਡੈਂਸੀ ਦੀ ਰਿਪੋਰਟ ਕਰਦਾ ਹੈ, ਤਾਂ ਬਾਅਦ ਦੇ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਮੇਟਾਗੇਨੋਮਿਕ ਸੈੱਲਾਂ ਅਤੇ ਬਾਹਰੀ ਜੀਨੋਮ ਨੂੰ ਸੁਰੱਖਿਅਤ ਕਰੋ।ਇਹਨਾਂ ਸਕੋਰਾਂ ਨੂੰ ਫਿਰ ਕਮਿਊਨਿਟੀ ਮਾਪਦੰਡ 60 ਦੇ ਅਨੁਸਾਰ ਜੀਨੋਮ ਗੁਣਵੱਤਾ ਦਾ ਵਰਗੀਕਰਨ ਕਰਨ ਲਈ ਮਤਲਬ ਸੰਪੂਰਨਤਾ (mcpl) ਅਤੇ ਮਤਲਬ ਗੰਦਗੀ (mctn) ਵਿੱਚ ਜੋੜਿਆ ਗਿਆ ਸੀ: ਉੱਚ ਗੁਣਵੱਤਾ: mcpl ≥ 90% ਅਤੇ mctn ≤ 5%;ਚੰਗੀ ਕੁਆਲਿਟੀ: mcpl ≥ 70%, mctn ≤ 10%, ਮੱਧਮ ਗੁਣਵੱਤਾ: mcpl ≥ 50% ਅਤੇ mctn ≤ 10%, ਨਿਰਪੱਖ ਗੁਣਵੱਤਾ: mcpl ≤ 90% ਜਾਂ mctn ≥ 10%।ਫਿਲਟਰ ਕੀਤੇ ਜੀਨੋਮ ਨੂੰ ਫਿਰ ਕੁਆਲਿਟੀ ਸਕੋਰ (Q ਅਤੇ Q') ਨਾਲ ਇਸ ਤਰ੍ਹਾਂ ਜੋੜਿਆ ਗਿਆ ਸੀ: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (ਸਟੇਨ ਪਰਿਵਰਤਨਸ਼ੀਲਤਾ)/100 + 0.5 x ਲੌਗ[N50]।(dRep61 ਵਿੱਚ ਲਾਗੂ)।
ਵੱਖ-ਵੱਖ ਡਾਟਾ ਸਰੋਤਾਂ ਅਤੇ ਜੀਨੋਮ ਕਿਸਮਾਂ (MAG, SAG ਅਤੇ REF) ਵਿਚਕਾਰ ਤੁਲਨਾਤਮਕ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਇਜਾਜ਼ਤ ਦੇਣ ਲਈ, dRep (v.2.5.4) ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਜੀਨੋਮ-ਵਿਆਪਕ ਔਸਤ ਨਿਊਕਲੀਓਟਾਈਡ ਪਛਾਣ (ANI) ਦੇ ਆਧਾਰ 'ਤੇ 34,799 ਜੀਨੋਮ ਨੂੰ ਡੀਰੇਫਰੈਂਸ ਕੀਤਾ ਗਿਆ ਸੀ।ਦੁਹਰਾਉਂਦਾ ਹੈ)61 95% ANI ਥ੍ਰੈਸ਼ਹੋਲਡਜ਼ 28,62 (-comp 0 -con 1000 -sa 0.95 -nc 0.2) ਦੇ ਨਾਲ ਅਤੇ ਸਪੀਸੀਜ਼ ਪੱਧਰ 'ਤੇ ਜੀਨੋਮ ਕਲੱਸਟਰਿੰਗ ਪ੍ਰਦਾਨ ਕਰਨ ਵਾਲੇ SpecI63 ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਸਿੰਗਲ-ਕਾਪੀ ਮਾਰਕਰ ਜੀਨ।ਉੱਪਰ ਪਰਿਭਾਸ਼ਿਤ ਅਧਿਕਤਮ ਕੁਆਲਿਟੀ ਸਕੋਰ (Q') ਦੇ ਅਨੁਸਾਰ ਹਰੇਕ dRep ਕਲੱਸਟਰ ਲਈ ਇੱਕ ਪ੍ਰਤੀਨਿਧੀ ਜੀਨੋਮ ਚੁਣਿਆ ਗਿਆ ਸੀ, ਜਿਸ ਨੂੰ ਸਪੀਸੀਜ਼ ਦਾ ਪ੍ਰਤੀਨਿਧ ਮੰਨਿਆ ਜਾਂਦਾ ਸੀ।
ਮੈਪਿੰਗ ਸਪੀਡ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ, BWA (v.0.7.17-r1188, -a) ਦੀ ਵਰਤੋਂ OMD ਵਿੱਚ ਮੌਜੂਦ 34,799 ਜੀਨੋਮ ਦੇ ਨਾਲ ਮੈਟਾਜੇਨੋਮਿਕ ਰੀਡ ਦੇ ਸਾਰੇ 1038 ਸੈੱਟਾਂ ਨੂੰ ਮੈਪ ਕਰਨ ਲਈ ਕੀਤੀ ਗਈ ਸੀ।ਕੁਆਲਿਟੀ-ਨਿਯੰਤਰਿਤ ਰੀਡਜ਼ ਨੂੰ ਸਿੰਗਲ-ਐਂਡ ਮੋਡ ਵਿੱਚ ਮੈਪ ਕੀਤਾ ਗਿਆ ਸੀ ਅਤੇ ਨਤੀਜੇ ਵਜੋਂ ਅਲਾਈਨਮੈਂਟਾਂ ਨੂੰ ਸਿਰਫ਼ ਅਲਾਈਨਮੈਂਟਾਂ ≥45 bp ਲੰਬਾਈ ਵਿੱਚ ਬਰਕਰਾਰ ਰੱਖਣ ਲਈ ਫਿਲਟਰ ਕੀਤਾ ਗਿਆ ਸੀ।ਅਤੇ ਪਛਾਣ ≥95%।ਹਰੇਕ ਨਮੂਨੇ ਲਈ ਡਿਸਪਲੇ ਅਨੁਪਾਤ ਫਿਲਟਰੇਸ਼ਨ ਤੋਂ ਬਾਅਦ ਬਾਕੀ ਬਚੀਆਂ ਰੀਡਿੰਗਾਂ ਦੀ ਪ੍ਰਤੀਸ਼ਤਤਾ ਨੂੰ ਗੁਣਵੱਤਾ ਨਿਯੰਤਰਣ ਰੀਡਿੰਗਾਂ ਦੀ ਕੁੱਲ ਸੰਖਿਆ ਨਾਲ ਵੰਡਿਆ ਜਾਂਦਾ ਹੈ।ਉਸੇ ਪਹੁੰਚ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਹਰੇਕ 1038 ਮੇਟਾਜੇਨੋਮ ਨੂੰ 5 ਮਿਲੀਅਨ ਇਨਸਰਟਸ (ਵਿਸਤ੍ਰਿਤ ਡੇਟਾ, ਚਿੱਤਰ 1c) ਤੱਕ ਘਟਾ ਦਿੱਤਾ ਗਿਆ ਸੀ ਅਤੇ OMD ਅਤੇ ਸਾਰੇ GEM16 ਵਿੱਚ GORG SAG ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਸੀ।GEM16 ਕੈਟਾਲਾਗ ਵਿੱਚ ਸਮੁੰਦਰੀ ਪਾਣੀ ਤੋਂ ਬਰਾਮਦ ਕੀਤੇ MAGs ਦੀ ਮਾਤਰਾ ਸਮੁੰਦਰੀ ਪਾਣੀ ਦੇ ਨਮੂਨਿਆਂ ਦੀ ਚੋਣ ਕਰਕੇ, ਮੈਟਾਜੇਨੋਮਿਕ ਸਰੋਤਾਂ ਦੇ ਕੀਵਰਡ ਸਵਾਲਾਂ ਦੁਆਰਾ ਨਿਰਧਾਰਤ ਕੀਤੀ ਗਈ ਸੀ (ਉਦਾਹਰਨ ਲਈ, ਸਮੁੰਦਰੀ ਤਲਛਟ ਦੇ ਉਲਟ)।ਖਾਸ ਤੌਰ 'ਤੇ, ਅਸੀਂ "ਜਲ" ਨੂੰ "ਈਕੋਸਿਸਟਮ_ਸ਼੍ਰੇਣੀ", "ਸਮੁੰਦਰੀ" ਨੂੰ "ਈਕੋਸਿਸਟਮ_ਟਾਈਪ" ਵਜੋਂ ਚੁਣਦੇ ਹਾਂ, ਅਤੇ "ਡੂੰਘੇ ਸਮੁੰਦਰ", "ਸਮੁੰਦਰੀ", "ਸਮੁੰਦਰੀ ਸਮੁੰਦਰੀ", "ਪੈਲੇਜਿਕ ਸਮੁੰਦਰੀ", "ਸਮੁੰਦਰੀ ਪਾਣੀ" ਵਜੋਂ ਫਿਲਟਰ ਕਰਦੇ ਹਾਂ। “ਸਮੁੰਦਰ”, “ਸਮੁੰਦਰੀ ਪਾਣੀ”, “ਸਤਿਹ ਸਮੁੰਦਰ ਦਾ ਪਾਣੀ”, “ਸਤਹ ਸਮੁੰਦਰ ਦਾ ਪਾਣੀ”।ਇਸ ਦੇ ਨਤੀਜੇ ਵਜੋਂ 5903 MAGs (734 ਉੱਚ ਗੁਣਵੱਤਾ) 1823 OTUs (ਇੱਥੇ ਦੇਖੇ ਗਏ) ਤੋਂ ਵੱਧ ਵੰਡੇ ਗਏ।
GTDB r89 ਸੰਸਕਰਣ 13 ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾਉਣ ਵਾਲੇ ਡਿਫੌਲਟ ਮਾਪਦੰਡਾਂ ਦੇ ਨਾਲ GTDB-Tk (v.1.0.2)64 ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਪ੍ਰੋਕੈਰੀਓਟਿਕ ਜੀਨੋਮਜ਼ ਨੂੰ ਟੈਕਸੋਨੋਮਿਕ ਤੌਰ 'ਤੇ ਐਨੋਟੇਟ ਕੀਤਾ ਗਿਆ ਸੀ। Anvi'o ਦੀ ਵਰਤੋਂ ਡੋਮੇਨ ਪੂਰਵ-ਅਨੁਮਾਨ ਦੇ ਆਧਾਰ 'ਤੇ ਯੂਕੇਰੀਓਟਿਕ ਜੀਨੋਮ ਦੀ ਪਛਾਣ ਕਰਨ ਅਤੇ ≥50% ਅਤੇ ਰੀਡੰਡੈਂਸੀ%10 ਨੂੰ ਯਾਦ ਕਰਨ ਲਈ ਕੀਤੀ ਗਈ ਸੀ।ਇੱਕ ਸਪੀਸੀਜ਼ ਦੀ ਟੈਕਸੋਨੋਮਿਕ ਐਨੋਟੇਸ਼ਨ ਨੂੰ ਇਸਦੇ ਪ੍ਰਤੀਨਿਧੀ ਜੀਨੋਮ ਵਿੱਚੋਂ ਇੱਕ ਵਜੋਂ ਪਰਿਭਾਸ਼ਿਤ ਕੀਤਾ ਗਿਆ ਹੈ।ਯੂਕੇਰੀਓਟਸ (148 MAG) ਦੇ ਅਪਵਾਦ ਦੇ ਨਾਲ, ਹਰੇਕ ਜੀਨੋਮ ਨੂੰ ਪਹਿਲਾਂ ਪ੍ਰੋਕਾ (v.1.14.5)65 ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਕਾਰਜਸ਼ੀਲ ਤੌਰ 'ਤੇ ਐਨੋਟੇਟ ਕੀਤਾ ਗਿਆ ਸੀ, ਪੂਰੇ ਜੀਨਾਂ ਦਾ ਨਾਮ ਦਿੱਤਾ ਗਿਆ ਸੀ, ਲੋੜ ਅਨੁਸਾਰ "ਆਰਚੀਆ" ਜਾਂ "ਬੈਕਟੀਰੀਆ" ਪੈਰਾਮੀਟਰਾਂ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕੀਤਾ ਗਿਆ ਸੀ, ਜੋ ਗੈਰ- ਲਈ ਵੀ ਰਿਪੋਰਟ ਕੀਤਾ ਗਿਆ ਹੈ। ਕੋਡਿੰਗ ਜੀਨ.ਅਤੇ CRISPR ਖੇਤਰ, ਹੋਰ ਜੀਨੋਮਿਕ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਵਿਚਕਾਰ।fetchMG (v.1.2)66 ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਯੂਨੀਵਰਸਲ ਸਿੰਗਲ-ਕਾਪੀ ਮਾਰਕਰ ਜੀਨਾਂ (uscMG) ਦੀ ਪਛਾਣ ਕਰਕੇ ਪੂਰਵ-ਅਨੁਮਾਨਿਤ ਜੀਨਾਂ ਨੂੰ ਐਨੋਟੇਟ ਕਰੋ, ਐਗਨੋਗ (v.5.0)68 ਦੇ ਆਧਾਰ 'ਤੇ emapper (v.2.0.1)67 ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਆਰਥੋਲੋਗ ਸਮੂਹ ਅਤੇ ਪੁੱਛਗਿੱਛ ਨਿਰਧਾਰਤ ਕਰੋ।KEGG ਡਾਟਾਬੇਸ (10 ਫਰਵਰੀ, 2020 ਨੂੰ ਪ੍ਰਕਾਸ਼ਿਤ) 69. ਆਖਰੀ ਪੜਾਅ DIAMOND (v.0.9.30)70 ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਕੇਈਜੀਜੀ ਡੇਟਾਬੇਸ ਨਾਲ ਪ੍ਰੋਟੀਨ ਮਿਲਾ ਕੇ ਕੀਤਾ ਗਿਆ ਸੀ ਅਤੇ ≥70% ਦੀ ਇੱਕ ਪੁੱਛਗਿੱਛ ਅਤੇ ਵਿਸ਼ਾ ਕਵਰੇਜ ਸੀ।ਨਤੀਜਿਆਂ ਨੂੰ NCBI ਪ੍ਰੋਕੈਰੀਓਟਿਕ ਜੀਨੋਮ ਐਨੋਟੇਸ਼ਨ ਪਾਈਪਲਾਈਨ 71 ਦੇ ਅਨੁਸਾਰ ਵੱਧ ਤੋਂ ਵੱਧ ਸੰਭਾਵਿਤ ਬਿੱਟਰੇਟ ਦੇ ≥ 50% ਦੇ ਅਧਾਰ 'ਤੇ ਫਿਲਟਰ ਕੀਤਾ ਗਿਆ ਸੀ (ਆਪਣੇ ਆਪ ਨੂੰ ਲਿੰਕ ਕਰੋ)।ਡਿਫੌਲਟ ਪੈਰਾਮੀਟਰਾਂ ਅਤੇ ਵੱਖ-ਵੱਖ ਕਲੱਸਟਰ ਵਿਸਫੋਟਾਂ ਦੇ ਨਾਲ antiSMASH (v.5.1.0)72 ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਜੀਨੋਮ ਵਿੱਚ BGCs ਦੀ ਪਛਾਣ ਕਰਨ ਲਈ ਜੀਨ ਕ੍ਰਮ ਨੂੰ ਵੀ ਇਨਪੁਟ ਵਜੋਂ ਵਰਤਿਆ ਗਿਆ ਸੀ।ਸਾਰੇ ਜੀਨੋਮ ਅਤੇ ਐਨੋਟੇਸ਼ਨਾਂ ਨੂੰ ਵੈੱਬ (https://microbiomics.io/ocean/) 'ਤੇ ਉਪਲਬਧ ਪ੍ਰਸੰਗਿਕ ਮੈਟਾਡੇਟਾ ਦੇ ਨਾਲ OMD ਵਿੱਚ ਕੰਪਾਇਲ ਕੀਤਾ ਗਿਆ ਹੈ।
ਪਹਿਲਾਂ ਵਰਣਿਤ ਵਿਧੀਆਂ 12,22 ਵਾਂਗ ਹੀ ਅਸੀਂ CD-HIT (v.4.8.1) ਦੀ ਵਰਤੋਂ 56.6 ਮਿਲੀਅਨ ਪ੍ਰੋਟੀਨ-ਕੋਡਿੰਗ ਜੀਨਾਂ ਨੂੰ ਬੈਕਟੀਰੀਆ ਅਤੇ ਪੁਰਾਤੱਤਵ ਜੀਨੋਮ ਤੋਂ OMD ਤੋਂ 95% ਪਛਾਣ ਅਤੇ ਛੋਟੇ ਜੀਨਾਂ (90% ਕਵਰੇਜ) ਵਿੱਚ 73 ਤੱਕ ਕਲੱਸਟਰ ਕਰਨ ਲਈ ਕੀਤੀ। >17.7 ਮਿਲੀਅਨ ਜੀਨ ਕਲੱਸਟਰ।ਸਭ ਤੋਂ ਲੰਬਾ ਕ੍ਰਮ ਹਰੇਕ ਜੀਨ ਕਲੱਸਟਰ ਲਈ ਪ੍ਰਤੀਨਿਧੀ ਜੀਨ ਵਜੋਂ ਚੁਣਿਆ ਗਿਆ ਸੀ।1038 ਮੇਟਾਜੇਨੋਮ ਨੂੰ ਫਿਰ> 17.7 ਮਿਲੀਅਨ BWA (-a) ਕਲੱਸਟਰ ਮੈਂਬਰਾਂ ਨਾਲ ਮੇਲ ਕੀਤਾ ਗਿਆ ਸੀ ਅਤੇ ਨਤੀਜੇ ਵਜੋਂ BAM ਫਾਈਲਾਂ ਨੂੰ ਸਿਰਫ ≥95% ਪ੍ਰਤੀਸ਼ਤ ਪਛਾਣ ਅਤੇ ≥45 ਬੇਸ ਅਲਾਈਨਮੈਂਟਾਂ ਨਾਲ ਅਲਾਈਨਮੈਂਟ ਬਰਕਰਾਰ ਰੱਖਣ ਲਈ ਫਿਲਟਰ ਕੀਤਾ ਗਿਆ ਸੀ।ਲੰਬਾਈ-ਸਧਾਰਨ ਜੀਨ ਦੀ ਬਹੁਤਾਤ ਦੀ ਗਣਨਾ ਸਭ ਤੋਂ ਵਧੀਆ ਵਿਲੱਖਣ ਅਲਾਈਨਮੈਂਟ ਤੋਂ ਸੰਮਿਲਨਾਂ ਦੀ ਗਿਣਤੀ ਦੁਆਰਾ ਕੀਤੀ ਗਈ ਸੀ ਅਤੇ ਫਿਰ, ਫਜ਼ੀ-ਮੈਪ ਕੀਤੇ ਸੰਮਿਲਨਾਂ ਲਈ, ਉਹਨਾਂ ਦੇ ਵਿਲੱਖਣ ਸੰਮਿਲਨਾਂ ਦੀ ਸੰਖਿਆ ਦੇ ਅਨੁਪਾਤੀ ਟੀਚੇ ਵਾਲੇ ਜੀਨਾਂ ਵਿੱਚ ਫ੍ਰੈਕਸ਼ਨਲ ਗਿਣਤੀ ਜੋੜ ਕੇ।
ਇੱਕ ਵਿਸਤ੍ਰਿਤ MOTU ਸੰਦਰਭ ਡੇਟਾਬੇਸ ਬਣਾਉਣ ਲਈ ਵਿਸਤ੍ਰਿਤ OMD (“Ca. Eudormicrobiaceae” ਤੋਂ ਵਾਧੂ MAGs ਦੇ ਨਾਲ, ਹੇਠਾਂ ਦੇਖੋ) ਦੇ ਜੀਨੋਮ ਨੂੰ mOTUs74 ਮੇਟਾਜੇਨੋਮਿਕ ਵਿਸ਼ਲੇਸ਼ਣ ਟੂਲ ਡੇਟਾਬੇਸ (v.2.5.1) ਵਿੱਚ ਜੋੜਿਆ ਗਿਆ ਸੀ।ਦਸ uscMGs ਵਿੱਚੋਂ ਸਿਰਫ਼ ਛੇ ਸਿੰਗਲ-ਕਾਪੀ ਜੀਨੋਮ (23,528 ਜੀਨੋਮ) ਬਚੇ ਹਨ।ਡਾਟਾਬੇਸ ਦੇ ਵਿਸਤਾਰ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਸਪੀਸੀਜ਼ ਪੱਧਰ 'ਤੇ 4,494 ਵਾਧੂ ਕਲੱਸਟਰ ਹੋਏ।1038 ਮੈਟਾਜੇਨੋਮ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਡਿਫਾਲਟ ਮੋਟੂ ਪੈਰਾਮੀਟਰਾਂ (v.2) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਕੀਤਾ ਗਿਆ ਸੀ।644 moTU ਕਲੱਸਟਰਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਕੁੱਲ 989 ਜੀਨੋਮ (95% REF, 5% SAG ਅਤੇ 99.9% MarDB ਨਾਲ ਸਬੰਧਤ) ਨੂੰ MOTU ਪ੍ਰੋਫਾਈਲ ਦੁਆਰਾ ਖੋਜਿਆ ਨਹੀਂ ਗਿਆ ਸੀ।ਇਹ MarDB ਜੀਨੋਮ ਦੇ ਸਮੁੰਦਰੀ ਅਲੱਗ-ਥਲੱਗ ਦੇ ਵੱਖ-ਵੱਖ ਵਾਧੂ ਸਰੋਤਾਂ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ (ਜ਼ਿਆਦਾਤਰ ਅਣਪਛਾਤੇ ਜੀਨੋਮ ਤਲਛਟ, ਸਮੁੰਦਰੀ ਮੇਜ਼ਬਾਨਾਂ, ਆਦਿ ਤੋਂ ਅਲੱਗ ਕੀਤੇ ਜੀਵਾਂ ਨਾਲ ਜੁੜੇ ਹੋਏ ਹਨ)।ਇਸ ਅਧਿਐਨ ਵਿੱਚ ਖੁੱਲੇ ਸਮੁੰਦਰੀ ਵਾਤਾਵਰਣ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਨਾ ਜਾਰੀ ਰੱਖਣ ਲਈ, ਅਸੀਂ ਉਹਨਾਂ ਨੂੰ ਡਾਊਨਸਟ੍ਰੀਮ ਵਿਸ਼ਲੇਸ਼ਣ ਤੋਂ ਬਾਹਰ ਰੱਖਿਆ ਹੈ ਜਦੋਂ ਤੱਕ ਕਿ ਉਹਨਾਂ ਨੂੰ ਖੋਜਿਆ ਜਾਂ ਇਸ ਅਧਿਐਨ ਵਿੱਚ ਬਣਾਏ ਗਏ ਵਿਸਤ੍ਰਿਤ MOTU ਡੇਟਾਬੇਸ ਵਿੱਚ ਸ਼ਾਮਲ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਸੀ।
OMD (ਉੱਪਰ ਦੇਖੋ) ਵਿੱਚ MAG, SAG ਅਤੇ REF ਦੇ ਸਾਰੇ BGCs ਨੂੰ BGCs ਦੇ ਨਾਲ ਮਿਲਾ ਦਿੱਤਾ ਗਿਆ ਸੀ ਜੋ ਸਾਰੇ ਮੈਟਾਜੇਨੋਮਿਕ ਸਕੈਫੋਲਡਜ਼ (ਐਂਟੀਸਮੈਸ਼ v.5.0, ਡਿਫੌਲਟ ਪੈਰਾਮੀਟਰ) ਵਿੱਚ ਪਛਾਣੇ ਗਏ ਸਨ ਅਤੇ ਬਿਗ-ਸਲਾਈਸ (v.1.1) (PFAM ਡੋਮੇਨ) 75 ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਵਿਸ਼ੇਸ਼ਤਾ ਰੱਖਦੇ ਸਨ।ਇਹਨਾਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਅਧਾਰ 'ਤੇ, ਅਸੀਂ BGCs ਦੇ ਵਿਚਕਾਰ ਸਾਰੀਆਂ ਕੋਸਾਈਨ ਦੂਰੀਆਂ ਦੀ ਗਣਨਾ ਕੀਤੀ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਕ੍ਰਮਵਾਰ 0.2 ਅਤੇ 0.8 ਦੀ ਦੂਰੀ ਥ੍ਰੈਸ਼ਹੋਲਡ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ GCF ਅਤੇ GCC ਵਿੱਚ ਸਮੂਹ ਕੀਤਾ (ਮਤਲਬ ਲਿੰਕ)।ਇਹ ਥ੍ਰੈਸ਼ਹੋਲਡ ਕੋਸਾਈਨ ਦੂਰੀ ਦੇ ਨਾਲ ਯੂਕਲੀਡੀਅਨ ਦੂਰੀ 75 ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਪਹਿਲਾਂ ਵਰਤੇ ਗਏ ਥ੍ਰੈਸ਼ਹੋਲਡ ਦਾ ਇੱਕ ਅਨੁਕੂਲਨ ਹਨ, ਜੋ ਮੂਲ ਬਿਗ-ਸਲਾਈਸ ਕਲੱਸਟਰਿੰਗ ਰਣਨੀਤੀ (ਪੂਰਕ ਜਾਣਕਾਰੀ) ਵਿੱਚ ਕੁਝ ਗਲਤੀਆਂ ਨੂੰ ਦੂਰ ਕਰਦਾ ਹੈ।
BGCs ਨੂੰ ਫਿਰ ਸਕੈਫੋਲਡਾਂ 'ਤੇ ਸਿਰਫ ≥5 kb ਏਨਕੋਡਡ ਨੂੰ ਬਰਕਰਾਰ ਰੱਖਣ ਲਈ ਫਿਲਟਰ ਕੀਤਾ ਗਿਆ ਸੀ ਤਾਂ ਜੋ ਪਹਿਲਾਂ ਦੱਸਿਆ ਗਿਆ ਹੈ 16 ਦੇ ਤੌਰ 'ਤੇ ਫ੍ਰੈਗਮੈਂਟੇਸ਼ਨ ਦੇ ਜੋਖਮ ਨੂੰ ਘੱਟ ਕੀਤਾ ਜਾ ਸਕੇ ਅਤੇ 1038 ਮੈਟਾਜੇਨੋਮਜ਼ (ਉਪਰੋਕਤ ਦੇਖੋ) ਵਿੱਚ ਨਹੀਂ ਮਿਲੇ MarDB REFs ਅਤੇ SAGs ਨੂੰ ਬਾਹਰ ਕੱਢਣ ਲਈ।ਇਸ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਕੁੱਲ 39,055 BGCs ਨੂੰ OMD ਜੀਨੋਮ ਦੁਆਰਾ ਏਨਕੋਡ ਕੀਤਾ ਗਿਆ ਸੀ, ਜਿਸ ਵਿੱਚ ਇੱਕ ਵਾਧੂ 14,106 ਦੀ ਪਛਾਣ ਮੈਟਾਜੇਨੋਮਿਕ ਟੁਕੜਿਆਂ 'ਤੇ ਕੀਤੀ ਗਈ ਸੀ (ਭਾਵ MAGs ਵਿੱਚ ਜੋੜਿਆ ਨਹੀਂ ਗਿਆ)।ਇਹ "ਮੈਟਾਜੇਨੋਮਿਕ" BGCs ਦੀ ਵਰਤੋਂ ਡੇਟਾਬੇਸ (ਪੂਰਕ ਜਾਣਕਾਰੀ) ਵਿੱਚ ਕੈਪਚਰ ਨਾ ਕੀਤੇ ਗਏ ਸਮੁੰਦਰੀ ਮਾਈਕ੍ਰੋਬਾਇਓਮ ਬਾਇਓਸਿੰਥੇਸਿਸ ਸੰਭਾਵੀ ਦੇ ਅਨੁਪਾਤ ਦਾ ਅਨੁਮਾਨ ਲਗਾਉਣ ਲਈ ਕੀਤੀ ਗਈ ਸੀ।ਹਰੇਕ BGC ਨੂੰ BiG-SCAPE76 ਵਿੱਚ ਪਰਿਭਾਸ਼ਿਤ ਐਂਟੀ-SMASH ਜਾਂ ਮੋਟੇ ਉਤਪਾਦ ਸ਼੍ਰੇਣੀਆਂ ਦੁਆਰਾ ਪਰਿਭਾਸ਼ਿਤ ਭਵਿੱਖਬਾਣੀ ਉਤਪਾਦ ਕਿਸਮਾਂ ਦੇ ਅਨੁਸਾਰ ਕਾਰਜਸ਼ੀਲ ਤੌਰ 'ਤੇ ਵਿਸ਼ੇਸ਼ਤਾ ਦਿੱਤੀ ਗਈ ਸੀ।ਮਾਤਰਾ ਵਿੱਚ ਨਮੂਨੇ ਦੇ ਪੱਖਪਾਤ ਨੂੰ ਰੋਕਣ ਲਈ (GCC/GCF ਦੀ ਵਰਗੀਕਰਨ ਅਤੇ ਕਾਰਜਾਤਮਕ ਰਚਨਾ, ਸੰਦਰਭ ਡੇਟਾਬੇਸ ਲਈ GCF ਅਤੇ GCC ਦੀ ਦੂਰੀ, ਅਤੇ GCF ਦੀ ਮੈਟਾਜੇਨੋਮਿਕ ਭਰਪੂਰਤਾ), ਹਰੇਕ ਸਪੀਸੀਜ਼ ਲਈ ਸਿਰਫ ਸਭ ਤੋਂ ਲੰਬਾ BGC ਪ੍ਰਤੀ GCF ਰੱਖ ਕੇ, 39,055 BGCs ਨੂੰ ਅੱਗੇ ਜੋੜਿਆ ਗਿਆ ਸੀ। ਨਤੀਜੇ ਵਜੋਂ ਕੁੱਲ 17,689 ਬੀ.ਜੀ.ਸੀ.
GCC ਅਤੇ GCF ਦੀ ਨਵੀਨਤਾ ਦਾ ਮੁਲਾਂਕਣ ਗਣਨਾ ਕੀਤੇ ਡੇਟਾਬੇਸ (BiG-FAM ਵਿੱਚ RefSeq ਡੇਟਾਬੇਸ) 29 ਅਤੇ ਪ੍ਰਯੋਗਾਤਮਕ ਤੌਰ 'ਤੇ ਪ੍ਰਮਾਣਿਤ (MIBIG 2.0) 30 BGC ਵਿਚਕਾਰ ਦੂਰੀ ਦੇ ਅਧਾਰ 'ਤੇ ਕੀਤਾ ਗਿਆ ਸੀ।17,689 ਪ੍ਰਤੀਨਿਧੀ BGCs ਵਿੱਚੋਂ ਹਰੇਕ ਲਈ, ਅਸੀਂ ਸੰਬੰਧਿਤ ਡੇਟਾਬੇਸ ਲਈ ਸਭ ਤੋਂ ਛੋਟੀ ਕੋਸਾਈਨ ਦੂਰੀ ਨੂੰ ਚੁਣਿਆ ਹੈ।ਇਹ ਘੱਟੋ-ਘੱਟ ਦੂਰੀਆਂ ਫਿਰ GCF ਜਾਂ GCC ਦੇ ਅਨੁਸਾਰ ਔਸਤਨ (ਔਸਤ) ਕੀਤੀਆਂ ਜਾਂਦੀਆਂ ਹਨ, ਜਿਵੇਂ ਉਚਿਤ ਹੋਵੇ।ਇੱਕ GCF ਨੂੰ ਨਵਾਂ ਮੰਨਿਆ ਜਾਂਦਾ ਹੈ ਜੇਕਰ ਡੇਟਾਬੇਸ ਦੀ ਦੂਰੀ 0.2 ਤੋਂ ਵੱਧ ਹੈ, ਜੋ ਕਿ (ਔਸਤ) GCF ਅਤੇ ਸੰਦਰਭ ਦੇ ਵਿਚਕਾਰ ਇੱਕ ਆਦਰਸ਼ ਵਿਭਾਜਨ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੈ।GCC ਲਈ, ਅਸੀਂ 0.4 ਦੀ ਚੋਣ ਕਰਦੇ ਹਾਂ, ਜੋ ਕਿ GCF ਦੁਆਰਾ ਪਰਿਭਾਸ਼ਿਤ ਥ੍ਰੈਸ਼ਹੋਲਡ ਦਾ ਦੁੱਗਣਾ ਹੈ, ਲਿੰਕਾਂ ਦੇ ਨਾਲ ਲੰਬੇ ਸਮੇਂ ਦੇ ਸਬੰਧਾਂ ਨੂੰ ਲਾਕ ਕਰਨ ਲਈ।
ਬੀਜੀਸੀ ਦੀ ਮੈਟਾਜੇਨੋਮਿਕ ਭਰਪੂਰਤਾ ਦਾ ਅੰਦਾਜ਼ਾ ਜੀਨ-ਪੱਧਰ ਦੇ ਪ੍ਰੋਫਾਈਲਾਂ ਤੋਂ ਉਪਲਬਧ ਇਸਦੇ ਬਾਇਓਸਿੰਥੈਟਿਕ ਜੀਨਾਂ (ਜਿਵੇਂ ਕਿ ਐਂਟੀ-ਸਮੈਸ਼ ਦੁਆਰਾ ਨਿਰਧਾਰਤ ਕੀਤਾ ਗਿਆ ਹੈ) ਦੀ ਔਸਤ ਭਰਪੂਰਤਾ ਵਜੋਂ ਲਗਾਇਆ ਗਿਆ ਸੀ।ਹਰੇਕ GCF ਜਾਂ GCC ਦੀ ਮੈਟਾਜੇਨੋਮਿਕ ਭਰਪੂਰਤਾ ਨੂੰ ਫਿਰ ਪ੍ਰਤੀਨਿਧੀ BGCs (17,689 ਵਿੱਚੋਂ) ਦੇ ਜੋੜ ਵਜੋਂ ਗਿਣਿਆ ਗਿਆ ਸੀ।ਇਹ ਭਰਪੂਰਤਾ ਦੇ ਨਕਸ਼ੇ ਬਾਅਦ ਵਿੱਚ ਪ੍ਰਤੀ-ਨਮੂਨਾ ਐਮਓਟੀਯੂ ਗਿਣਤੀ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਸੈਲੂਲਰ ਰਚਨਾ ਲਈ ਸਧਾਰਣ ਕੀਤੇ ਗਏ ਸਨ, ਜੋ ਕਿ ਕ੍ਰਮਵਾਰ ਕੋਸ਼ਿਸ਼ਾਂ (ਵਿਸਤ੍ਰਿਤ ਡੇਟਾ, ਚਿੱਤਰ 1d) ਲਈ ਵੀ ਜ਼ਿੰਮੇਵਾਰ ਸਨ।GCF ਜਾਂ GCC ਦੇ ਪ੍ਰਚਲਨ ਦੀ ਗਣਨਾ ਬਹੁਤਾਤ> 0 ਵਾਲੇ ਨਮੂਨਿਆਂ ਦੀ ਪ੍ਰਤੀਸ਼ਤ ਵਜੋਂ ਕੀਤੀ ਗਈ ਸੀ।
ਨਮੂਨਿਆਂ ਵਿਚਕਾਰ ਯੂਕਲੀਡੀਅਨ ਦੂਰੀ ਨੂੰ ਸਧਾਰਣ GCF ਪ੍ਰੋਫਾਈਲ ਤੋਂ ਗਿਣਿਆ ਗਿਆ ਸੀ।ਇਹਨਾਂ ਦੂਰੀਆਂ ਨੂੰ UMAP77 ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਆਕਾਰ ਵਿੱਚ ਘਟਾਇਆ ਗਿਆ ਸੀ ਅਤੇ ਨਤੀਜੇ ਵਜੋਂ ਏਮਬੈਡਿੰਗਾਂ ਨੂੰ HDBSCAN78 ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਗੈਰ-ਨਿਰੀਖਣ ਘਣਤਾ-ਅਧਾਰਿਤ ਕਲੱਸਟਰਿੰਗ ਲਈ ਵਰਤਿਆ ਗਿਆ ਸੀ।HDBSCAN ਦੁਆਰਾ ਵਰਤੇ ਗਏ ਕਲੱਸਟਰ (ਅਤੇ ਇਸ ਲਈ ਕਲੱਸਟਰਾਂ ਦੀ ਸੰਖਿਆ) ਲਈ ਪੁਆਇੰਟਾਂ ਦੀ ਸਰਵੋਤਮ ਨਿਊਨਤਮ ਸੰਖਿਆ ਕਲੱਸਟਰ ਮੈਂਬਰਸ਼ਿਪ ਦੀ ਸੰਚਤ ਸੰਭਾਵਨਾ ਨੂੰ ਵੱਧ ਤੋਂ ਵੱਧ ਕਰਕੇ ਨਿਰਧਾਰਤ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।ਪਛਾਣੇ ਗਏ ਕਲੱਸਟਰਾਂ (ਅਤੇ ਇਹਨਾਂ ਕਲੱਸਟਰਾਂ ਦੇ ਇੱਕ ਬੇਤਰਤੀਬੇ ਸੰਤੁਲਿਤ ਉਪ-ਨਮੂਨੇ ਨੂੰ ਪਰਮਿਊਟੇਸ਼ਨਲ ਮਲਟੀਵੇਰੀਏਟ ਵਿਸ਼ਲੇਸ਼ਣ (ਪਰਮਨੋਵਾ) ਵਿੱਚ ਪੱਖਪਾਤ ਲਈ ਲੇਖਾ ਜੋਖਾ ਕਰਨ ਲਈ) ਪਰਮਾਨੋਵਾ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਅਨਿਯਮਤ ਯੂਕਲੀਡੀਅਨ ਦੂਰੀਆਂ ਦੇ ਵਿਰੁੱਧ ਮਹੱਤਤਾ ਲਈ ਟੈਸਟ ਕੀਤਾ ਗਿਆ ਸੀ।ਨਮੂਨਿਆਂ ਦੇ ਔਸਤ ਜੀਨੋਮ ਆਕਾਰ ਦੀ ਗਣਨਾ mOTU ਦੀ ਤੁਲਨਾਤਮਕ ਭਰਪੂਰਤਾ ਅਤੇ ਜੀਨੋਮ ਦੇ ਮੈਂਬਰਾਂ ਦੇ ਅਨੁਮਾਨਿਤ ਜੀਨੋਮ ਆਕਾਰ ਦੇ ਅਧਾਰ ਤੇ ਕੀਤੀ ਗਈ ਸੀ।ਖਾਸ ਤੌਰ 'ਤੇ, ਹਰੇਕ ਐਮਓਟੀਯੂ ਦੇ ਔਸਤ ਜੀਨੋਮ ਆਕਾਰ ਦਾ ਅੰਦਾਜ਼ਾ ਇਸਦੇ ਮੈਂਬਰਾਂ ਦੇ ਜੀਨੋਮ ਆਕਾਰਾਂ ਦੀ ਔਸਤ ਦੇ ਤੌਰ 'ਤੇ ਸੰਪੂਰਨਤਾ (ਫਿਲਟਰ ਕਰਨ ਤੋਂ ਬਾਅਦ) ਲਈ ਠੀਕ ਕੀਤਾ ਗਿਆ ਸੀ (ਉਦਾਹਰਨ ਲਈ, 3 Mb ਦੀ ਲੰਬਾਈ ਵਾਲੇ 75% ਸੰਪੂਰਨ ਜੀਨੋਮ ਦਾ ਅਡਜਸਟਡ ਆਕਾਰ 4 ਹੁੰਦਾ ਹੈ। Mb).ਇਕਸਾਰਤਾ ਵਾਲੇ ਮੱਧਮ ਜੀਨੋਮ ਲਈ ≥70%।ਹਰੇਕ ਨਮੂਨੇ ਲਈ ਔਸਤ ਜੀਨੋਮ ਆਕਾਰ ਦੀ ਗਣਨਾ ਫਿਰ ਸਾਪੇਖਿਕ ਭਰਪੂਰਤਾ ਦੁਆਰਾ ਵਜ਼ਨ ਵਾਲੇ MOTU ਜੀਨੋਮ ਆਕਾਰ ਦੇ ਜੋੜ ਵਜੋਂ ਕੀਤੀ ਗਈ ਸੀ।
OMD ਵਿੱਚ ਜੀਨੋਮ-ਏਨਕੋਡ ਕੀਤੇ BGCs ਦਾ ਇੱਕ ਫਿਲਟਰ ਕੀਤਾ ਸੈੱਟ ਬੈਕਟੀਰੀਆ ਅਤੇ ਪੁਰਾਤੱਤਵ GTDB ਰੁੱਖਾਂ ਵਿੱਚ ਦਿਖਾਇਆ ਗਿਆ ਹੈ (≥5 kb ਫਰੇਮਵਰਕ ਵਿੱਚ, REF ਅਤੇ SAG MarDB ਨੂੰ ਛੱਡ ਕੇ, ਜੋ ਕਿ 1038 metagenomes ਵਿੱਚ ਨਹੀਂ ਮਿਲੇ ਹਨ, ਉੱਪਰ ਦੇਖੋ) ਅਤੇ ਉਹਨਾਂ ਦੀ ਪੂਰਵ-ਅਨੁਮਾਨਿਤ ਉਤਪਾਦ ਸ਼੍ਰੇਣੀਆਂ ਦੇ ਆਧਾਰ 'ਤੇ ਫਾਈਨੇਟਿਕ ਜੀਨੋਮ ਦੀ ਸਥਿਤੀ (ਉੱਪਰ ਦੇਖੋ)।ਅਸੀਂ ਪ੍ਰਤੀਨਿਧੀ ਵਜੋਂ ਉਸ ਸਪੀਸੀਜ਼ ਵਿੱਚ ਸਭ ਤੋਂ ਵੱਧ BGCs ਵਾਲੇ ਜੀਨੋਮ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਪ੍ਰਜਾਤੀਆਂ ਦੁਆਰਾ ਡੇਟਾ ਨੂੰ ਪਹਿਲਾਂ ਘਟਾਇਆ।ਵਿਜ਼ੂਅਲਾਈਜ਼ੇਸ਼ਨ ਲਈ, ਨੁਮਾਇੰਦਿਆਂ ਨੂੰ ਅੱਗੇ ਰੁੱਖਾਂ ਦੇ ਸਮੂਹਾਂ ਵਿੱਚ ਵੰਡਿਆ ਗਿਆ ਸੀ, ਅਤੇ ਦੁਬਾਰਾ, ਹਰੇਕ ਸੈੱਲ ਕਲੇਡ ਲਈ, ਸਭ ਤੋਂ ਵੱਡੀ ਗਿਣਤੀ ਵਾਲੇ ਜੀਨੋਮ ਨੂੰ ਇੱਕ ਪ੍ਰਤੀਨਿਧੀ ਵਜੋਂ ਚੁਣਿਆ ਗਿਆ ਸੀ।ਉਹਨਾਂ BGCs ਵਿੱਚ ਏਨਕੋਡ ਕੀਤੇ ਉਤਪਾਦ ਕਿਸਮਾਂ ਲਈ ਸ਼ੈਨਨ ਡਾਇਵਰਸਿਟੀ ਇੰਡੈਕਸ ਦੀ ਗਣਨਾ ਕਰਕੇ BGC-ਅਨੁਕੂਲ ਸਪੀਸੀਜ਼ (>15 BGCs ਵਾਲਾ ਘੱਟੋ-ਘੱਟ ਇੱਕ ਜੀਨੋਮ) ਦਾ ਹੋਰ ਵਿਸ਼ਲੇਸ਼ਣ ਕੀਤਾ ਗਿਆ।ਜੇਕਰ ਸਾਰੀਆਂ ਪੂਰਵ-ਅਨੁਮਾਨਿਤ ਉਤਪਾਦ ਕਿਸਮਾਂ ਇੱਕੋ ਜਿਹੀਆਂ ਹਨ, ਤਾਂ ਰਸਾਇਣਕ ਹਾਈਬ੍ਰਿਡ ਅਤੇ ਹੋਰ ਗੁੰਝਲਦਾਰ BGCs (ਜਿਵੇਂ ਕਿ ਐਂਟੀ-SMAH ਦੁਆਰਾ ਪੂਰਵ-ਅਨੁਮਾਨ ਕੀਤਾ ਗਿਆ ਹੈ) ਨੂੰ ਉਸੇ ਉਤਪਾਦ ਕਿਸਮ ਨਾਲ ਸਬੰਧਤ ਮੰਨਿਆ ਜਾਂਦਾ ਹੈ, ਭਾਵੇਂ ਉਹ ਸਮੂਹ ਵਿੱਚ ਉਹਨਾਂ ਦੇ ਕ੍ਰਮ ਦੀ ਪਰਵਾਹ ਕੀਤੇ ਬਿਨਾਂ (ਜਿਵੇਂ ਕਿ ਪ੍ਰੋਟੀਨ-ਬੈਕਟੀਰੀਓਸਿਨ ਅਤੇ ਬੈਕਟੀਰੀਓਸਿਨ-ਪ੍ਰੋਟੀਓਪ੍ਰੋਟੀਨ ਫਿਊਜ਼ਨ) ਸਰੀਰ).ਹਾਈਬ੍ਰਿਡ)।
ਮਾਲਾਸਪੀਨਾ ਨਮੂਨੇ MP1648 ਤੋਂ ਬਾਕੀ ਬਚਿਆ DNA (ਅੰਦਾਜ਼ਾ 6 ng), ਜੈਵਿਕ ਨਮੂਨੇ SAMN05421555 ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੈ ਅਤੇ ਛੋਟੇ ਰੀਡ ਲਈ Illumina SRR3962772 ਮੈਟਾਜੇਨੋਮਿਕ ਰੀਡ ਸੈੱਟ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੈ, pacBio ਕ੍ਰਮਵਾਰ ਪ੍ਰੋਟੋਕੋਲ ਦੇ ਅਨੁਸਾਰ ਪ੍ਰੋਸੈਸ ਕੀਤਾ ਗਿਆ ਹੈ ਕਿੱਟ (100-980-000) ਅਤੇ SMRTbell ਐਕਸਪ੍ਰੈਸ 2.0 ਟੈਂਪਲੇਟ ਤਿਆਰੀ ਕਿੱਟ (100-938-900)।ਸੰਖੇਪ ਵਿੱਚ, ਬਾਕੀ ਬਚੇ ਡੀਐਨਏ ਨੂੰ ਕੋਵਾਰਿਸ (ਜੀ-ਟਿਊਬ, 52104) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਕੱਟਿਆ, ਮੁਰੰਮਤ ਅਤੇ ਸ਼ੁੱਧ ਕੀਤਾ ਗਿਆ (ਪ੍ਰੋਨੇਕਸ ਬੀਡਸ)।ਸ਼ੁੱਧ ਡੀਐਨਏ ਨੂੰ ਫਿਰ ਇੱਕ ਅੰਤਮ ਸ਼ੁੱਧੀਕਰਨ ਪੜਾਅ (ਪ੍ਰੋਨੇਕਸ ਮਣਕੇ) ਅਤੇ ਸੀਕਵਲ II ਪਲੇਟਫਾਰਮ 'ਤੇ ਕ੍ਰਮ ਤੋਂ ਪਹਿਲਾਂ ਲਾਇਬ੍ਰੇਰੀ ਦੀ ਤਿਆਰੀ, ਐਂਪਲੀਫਿਕੇਸ਼ਨ, ਸ਼ੁੱਧੀਕਰਨ (ਪ੍ਰੋਨੇਕਸ ਮਣਕੇ) ਅਤੇ ਆਕਾਰ ਦੀ ਚੋਣ (>6 kb, ਬਲੂ ਪਿਪਿਨ) ਦੇ ਅਧੀਨ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।
ਪਹਿਲੇ ਦੋ ca ਦਾ ਪੁਨਰ ਨਿਰਮਾਣ.MAG Eremiobacterota ਲਈ, ਅਸੀਂ ਛੇ ਵਾਧੂ ANIs>99% ਦੀ ਪਛਾਣ ਕੀਤੀ (ਇਹ ਚਿੱਤਰ 3 ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ), ਜੋ ਸ਼ੁਰੂ ਵਿੱਚ ਗੰਦਗੀ ਦੇ ਅੰਕਾਂ ਦੇ ਅਧਾਰ ਤੇ ਫਿਲਟਰ ਕੀਤੇ ਗਏ ਸਨ (ਬਾਅਦ ਵਿੱਚ ਜੀਨ ਡੁਪਲੀਕੇਸ਼ਨ ਵਜੋਂ ਪਛਾਣਿਆ ਗਿਆ, ਹੇਠਾਂ ਦੇਖੋ)।ਸਾਨੂੰ "Ca" ਲੇਬਲ ਵਾਲੀ ਇੱਕ ਟਰੇ ਵੀ ਮਿਲੀ।ਵੱਖ-ਵੱਖ ਅਧਿਐਨਾਂ ਤੋਂ Eremiobacterota”23 ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਸਾਡੇ ਅਧਿਐਨ ਤੋਂ ਅੱਠ MAGs ਦੇ ਨਾਲ 633 ਯੂਕੇਰੀਓਟਿਕ ਐਨਰਿਚਡ (>0.8 µm) ਨਮੂਨਿਆਂ ਤੋਂ BWA (v.0.7.17) Ref -r1188, – ਇੱਕ ਫਲੈਗ) ਦੇ ਨਮੂਨੇ ਲਈ ਇੱਕ ਸੰਦਰਭ ਵਜੋਂ ਵਰਤਿਆ ਗਿਆ। ਮੈਪਿੰਗ (5 ਮਿਲੀਅਨ ਰੀਡ)।ਸੰਸ਼ੋਧਨ-ਵਿਸ਼ੇਸ਼ ਨਕਸ਼ਿਆਂ ਦੇ ਆਧਾਰ 'ਤੇ (95% ਅਲਾਈਨਮੈਂਟ ਪਛਾਣ ਅਤੇ 80% ਰੀਡ ਕਵਰੇਜ ਦੁਆਰਾ ਫਿਲਟਰ ਕੀਤਾ ਗਿਆ), ਅਸੈਂਬਲੀ ਲਈ 10 ਮੈਟਾਜੇਨੋਮ (ਸੰਭਾਵਿਤ ਕਵਰੇਜ ≥5×) ਚੁਣੇ ਗਏ ਸਨ ਅਤੇ ਸਮੱਗਰੀ ਦੇ ਸਬੰਧਾਂ ਲਈ ਇੱਕ ਵਾਧੂ 49 ਮੇਟਾਜੇਨੋਮ (ਸੰਭਾਵਿਤ ਕਵਰੇਜ ≥1×) ਚੁਣੇ ਗਏ ਸਨ।ਉੱਪਰ ਦਿੱਤੇ ਸਮਾਨ ਮਾਪਦੰਡਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਇਹਨਾਂ ਨਮੂਨਿਆਂ ਨੂੰ ਬਿਨ ਕੀਤਾ ਗਿਆ ਸੀ ਅਤੇ 10 ਵਾਧੂ 'Ca' ਸ਼ਾਮਲ ਕੀਤੇ ਗਏ ਸਨ।MAG Eremiobacterota ਨੂੰ ਬਹਾਲ ਕੀਤਾ ਗਿਆ ਹੈ.ਇਹ 16 MAGs (ਪਹਿਲਾਂ ਹੀ ਡੇਟਾਬੇਸ ਵਿੱਚ ਦੋ ਦੀ ਗਿਣਤੀ ਨਹੀਂ ਕਰਦੇ) ਫੈਲੇ ਹੋਏ OMD ਵਿੱਚ ਜੀਨੋਮ ਦੀ ਕੁੱਲ ਸੰਖਿਆ ਨੂੰ 34,815 ਤੱਕ ਲਿਆਉਂਦੇ ਹਨ।MAGs ਨੂੰ ਉਹਨਾਂ ਦੀ ਜੀਨੋਮਿਕ ਸਮਾਨਤਾ ਅਤੇ GTDB ਵਿੱਚ ਸਥਿਤੀ ਦੇ ਅਧਾਰ ਤੇ ਟੈਕਸੋਨੋਮਿਕ ਰੈਂਕ ਦਿੱਤੇ ਗਏ ਹਨ।18 MAGs ਨੂੰ ਇੱਕੋ ਪਰਿਵਾਰ ਦੇ ਅੰਦਰ 5 ਸਪੀਸੀਜ਼ (ਇੰਟਰਾਸਪੈਸਿਫਿਕ ANI > 99%) ਅਤੇ 3 ਜਨਰਾ (ਇੰਟਰਾਜੇਨੇਰਿਕ ANI 85% ਤੋਂ 94%) ਵਿੱਚ dRep ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਹਟਾ ਦਿੱਤਾ ਗਿਆ ਸੀ79।ਸਪੀਸੀਜ਼ ਨੁਮਾਇੰਦਿਆਂ ਨੂੰ ਇਕਸਾਰਤਾ, ਗੰਦਗੀ, ਅਤੇ N50 ਦੇ ਅਧਾਰ ਤੇ ਹੱਥੀਂ ਚੁਣਿਆ ਗਿਆ ਸੀ।ਸੁਝਾਏ ਗਏ ਨਾਮਕਰਨ ਨੂੰ ਪੂਰਕ ਜਾਣਕਾਰੀ ਵਿੱਚ ਦਿੱਤਾ ਗਿਆ ਹੈ।
'Ca ਦੀ ਅਖੰਡਤਾ ਅਤੇ ਗੰਦਗੀ ਦਾ ਮੁਲਾਂਕਣ ਕਰੋ।MAG Eremiobacterota, ਅਸੀਂ uscMG ਦੀ ਮੌਜੂਦਗੀ ਦਾ ਮੁਲਾਂਕਣ ਕੀਤਾ, ਨਾਲ ਹੀ ਵੰਸ਼- ਅਤੇ ਡੋਮੇਨ-ਵਿਸ਼ੇਸ਼ ਸਿੰਗਲ-ਕਾਪੀ ਮਾਰਕਰ ਜੀਨ ਸੈੱਟਾਂ ਦਾ ਚੈਕਐਮ ਅਤੇ ਐਨਵੀਓ ਦੁਆਰਾ ਵਰਤੇ ਗਏ।40 uscMGs ਵਿੱਚੋਂ 2 ਡੁਪਲੀਕੇਟਸ ਦੀ ਪਛਾਣ ਦੀ ਪੁਸ਼ਟੀ ਫਾਈਲੋਜੈਨੇਟਿਕ ਪੁਨਰ ਨਿਰਮਾਣ (ਹੇਠਾਂ ਦੇਖੋ) ਦੁਆਰਾ ਕਿਸੇ ਵੀ ਸੰਭਾਵੀ ਗੰਦਗੀ ਨੂੰ ਰੱਦ ਕਰਨ ਲਈ ਕੀਤੀ ਗਈ ਸੀ (ਇਹ ਇਹਨਾਂ 40 ਮਾਰਕਰ ਜੀਨਾਂ ਦੇ ਅਧਾਰ ਤੇ 5% ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੈ)।ਪੰਜ ਪ੍ਰਤੀਨਿਧੀ MAGs 'Ca ਦਾ ਇੱਕ ਵਾਧੂ ਅਧਿਐਨ.ਇਹਨਾਂ ਪੁਨਰਗਠਿਤ ਜੀਨੋਮ ਵਿੱਚ ਗੰਦਗੀ ਦੇ ਹੇਠਲੇ ਪੱਧਰ ਦੀ ਬਹੁਤਾਤ ਅਤੇ ਕ੍ਰਮ ਰਚਨਾ ਸਬੰਧਾਂ (ਪੂਰਕ ਜਾਣਕਾਰੀ) 59 ਦੇ ਅਧਾਰ ਤੇ ਇੰਟਰਐਕਟਿਵ ਐਨਵੀਓ ਇੰਟਰਫੇਸ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ Eremiobacterota ਸਪੀਸੀਜ਼ ਲਈ ਪੁਸ਼ਟੀ ਕੀਤੀ ਗਈ ਸੀ।
ਫਾਈਲੋਜੀਨੋਮਿਕ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ, ਅਸੀਂ ਪੰਜ ਪ੍ਰਤੀਨਿਧੀ MAGs "Ca" ਦੀ ਚੋਣ ਕੀਤੀ।Eudormicrobiaceae", ਸਾਰੀਆਂ ਕਿਸਮਾਂ "Ca.Eremiobacterota ਅਤੇ ਹੋਰ ਫਾਈਲਾ ਦੇ ਮੈਂਬਰਾਂ (UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria ਅਤੇ Planctomycetota ਸਮੇਤ) ਦਾ ਜੀਨੋਮ GTDB (r89)13 ਤੋਂ ਉਪਲਬਧ ਹੈ।ਇਹ ਸਾਰੇ ਜੀਨੋਮ ਐਨੋਟੇਟ ਕੀਤੇ ਗਏ ਸਨ ਜਿਵੇਂ ਕਿ ਪਹਿਲਾਂ ਸਿੰਗਲ ਕਾਪੀ ਮਾਰਕਰ ਜੀਨ ਕੱਢਣ ਅਤੇ BGC ਐਨੋਟੇਸ਼ਨ ਲਈ ਵਰਣਨ ਕੀਤਾ ਗਿਆ ਸੀ।GTDB ਜੀਨੋਮ ਉਪਰੋਕਤ ਇਕਸਾਰਤਾ ਅਤੇ ਗੰਦਗੀ ਦੇ ਮਾਪਦੰਡਾਂ ਦੇ ਅਨੁਸਾਰ ਸੁਰੱਖਿਅਤ ਕੀਤੇ ਗਏ ਸਨ।ਫਾਈਲੋਜੈਨੇਟਿਕ ਵਿਸ਼ਲੇਸ਼ਣ Anvi'o Phylogenetics59 ਵਰਕਫਲੋ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਕੀਤਾ ਗਿਆ ਸੀ।ਦਰਖਤ ਨੂੰ IQTREE (v.2.0.3) (ਡਿਫਾਲਟ ਵਿਕਲਪਾਂ ਅਤੇ -bb 1000)80 ਦੀ ਵਰਤੋਂ ਕਰਕੇ Anvi'o (MUSCLE, v.3.8.1551)81 ਦੁਆਰਾ ਪਛਾਣੇ ਗਏ 39 ਟੈਂਡਮ ਰਾਈਬੋਸੋਮਲ ਪ੍ਰੋਟੀਨ ਦੀ ਇੱਕ ਅਲਾਈਨਮੈਂਟ 'ਤੇ ਬਣਾਇਆ ਗਿਆ ਸੀ।ਉਸ ਦੇ ਅਹੁਦੇ ਘਟਾ ਦਿੱਤੇ ਗਏ ਸਨ।ਜੀਨੋਮ 82 ਦੇ ਘੱਟੋ-ਘੱਟ 50% ਨੂੰ ਕਵਰ ਕਰਨ ਲਈ ਅਤੇ ਪਲੈਨਕਟੋਮਾਈਸੀਕੋਟਾ ਨੂੰ GTDB ਟ੍ਰੀ ਟੋਪੋਲੋਜੀ ਦੇ ਆਧਾਰ 'ਤੇ ਇੱਕ ਆਊਟਗਰੁੱਪ ਵਜੋਂ ਵਰਤਿਆ ਗਿਆ ਸੀ।40 uscMGs ਦਾ ਇੱਕ ਰੁੱਖ ਇੱਕੋ ਟੂਲ ਅਤੇ ਪੈਰਾਮੀਟਰਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਬਣਾਇਆ ਗਿਆ ਸੀ।
ਅਸੀਂ ਆਮ ਮਾਈਕਰੋਬਾਇਲ ਗੁਣਾਂ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਲਈ ਡਿਫੌਲਟ ਪੈਰਾਮੀਟਰਾਂ (ਫੀਨੋਟਾਈਪ, ਨਿਊਕਲੀਓਟਾਈਡਸ ਤੋਂ) 83 ਦੇ ਨਾਲ ਟ੍ਰੇਟਰ (v.1.1.2) ਦੀ ਵਰਤੋਂ ਕੀਤੀ।ਅਸੀਂ ਪਹਿਲਾਂ ਵਿਕਸਤ ਸ਼ਿਕਾਰੀ ਸੂਚਕਾਂਕ 84 ਦੇ ਅਧਾਰ ਤੇ ਇੱਕ ਸੰਭਾਵੀ ਸ਼ਿਕਾਰੀ ਜੀਵਨ ਸ਼ੈਲੀ ਦੀ ਖੋਜ ਕੀਤੀ ਜੋ ਜੀਨੋਮ ਵਿੱਚ ਇੱਕ ਪ੍ਰੋਟੀਨ-ਕੋਡਿੰਗ ਜੀਨ ਦੀ ਸਮੱਗਰੀ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ।ਖਾਸ ਤੌਰ 'ਤੇ, ਅਸੀਂ ਵਿਕਲਪਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ OrthoMCL ਡੇਟਾਬੇਸ (v.4)85 ਦੇ ਵਿਰੁੱਧ ਜੀਨੋਮ ਵਿੱਚ ਪ੍ਰੋਟੀਨ ਦੀ ਤੁਲਨਾ ਕਰਨ ਲਈ ਡਾਇਮੰਡ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਾਂ -ਵਧੇਰੇ-ਸੰਵੇਦਨਸ਼ੀਲ -ਆਈਡੀ 25 -ਕਵੇਰੀ-ਕਵਰ 70 -ਵਿਸ਼ੇ-ਕਵਰ 70 -ਟੌਪ 20 ਅਤੇ ਇਸਦੇ ਅਨੁਸਾਰੀ ਜੀਨਾਂ ਦੀ ਗਿਣਤੀ ਕਰਦੇ ਹਾਂ ਸ਼ਿਕਾਰੀ ਅਤੇ ਗੈਰ-ਸ਼ਿਕਾਰੀ ਲਈ ਮਾਰਕਰ ਜੀਨ।ਸੂਚਕਾਂਕ ਸ਼ਿਕਾਰੀ ਅਤੇ ਗੈਰ-ਸ਼ਿਕਾਰੀ ਨਿਸ਼ਾਨਾਂ ਦੀ ਸੰਖਿਆ ਵਿੱਚ ਅੰਤਰ ਹੈ।ਇੱਕ ਵਾਧੂ ਨਿਯੰਤਰਣ ਵਜੋਂ, ਅਸੀਂ "Ca" ਜੀਨੋਮ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਵੀ ਕੀਤਾ।Entotheonella TSY118 ਫੈਕਟਰ Ca ਨਾਲ ਇਸ ਦੇ ਸਬੰਧ 'ਤੇ ਆਧਾਰਿਤ ਹੈ।Eudoremicrobium (ਵੱਡਾ ਜੀਨੋਮ ਆਕਾਰ ਅਤੇ ਬਾਇਓਸਿੰਥੈਟਿਕ ਸੰਭਾਵੀ)।ਅੱਗੇ, ਅਸੀਂ ਸ਼ਿਕਾਰੀ ਅਤੇ ਗੈਰ-ਸ਼ਿਕਾਰੀ ਮਾਰਕਰ ਜੀਨਾਂ ਅਤੇ Ca ਦੀ ਬਾਇਓਸਿੰਥੈਟਿਕ ਸੰਭਾਵੀ ਵਿਚਕਾਰ ਸੰਭਾਵੀ ਸਬੰਧਾਂ ਦੀ ਜਾਂਚ ਕੀਤੀ।Eudormicrobiaceae” ਅਤੇ ਪਾਇਆ ਕਿ ਇੱਕ ਤੋਂ ਵੱਧ ਜੀਨ (ਕਿਸੇ ਵੀ ਕਿਸਮ ਦੇ ਮਾਰਕਰ ਜੀਨ ਤੋਂ, ਜਿਵੇਂ ਕਿ ਸ਼ਿਕਾਰੀ/ਗੈਰ-ਸ਼ਿਕਾਰੀ ਜੀਨ ਤੋਂ) BGC ਨਾਲ ਓਵਰਲੈਪ ਨਹੀਂ ਹੁੰਦਾ, ਇਹ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ BGC ਸ਼ਿਕਾਰ ਦੇ ਸੰਕੇਤਾਂ ਨੂੰ ਉਲਝਾਉਂਦਾ ਨਹੀਂ ਹੈ।ਸਕ੍ਰੈਬਲਡ ਪ੍ਰਤੀਕ੍ਰਿਤੀਆਂ ਦੀ ਵਾਧੂ ਜੀਨੋਮਿਕ ਐਨੋਟੇਸ਼ਨ TXSSCAN (v.1.0.2) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਵਿਸ਼ੇਸ਼ ਤੌਰ 'ਤੇ secretion ਸਿਸਟਮ, pili, ਅਤੇ flagella86 ਦੀ ਜਾਂਚ ਕਰਨ ਲਈ ਕੀਤੀ ਗਈ ਸੀ।
ਪੰਜ ਪ੍ਰਤੀਨਿਧ 'Ca' ਨੂੰ ਤਾਰਾ ਸਮੁੰਦਰਾਂ ਦੇ ਪ੍ਰੋਕੈਰੀਓਟਿਕ ਅਤੇ ਯੂਕੇਰੀਓਟਿਕ ਸੰਸ਼ੋਧਨ ਭਾਗਾਂ ਤੋਂ 623 ਮੈਟਾਟ੍ਰਾਂਸਕ੍ਰਿਪਟੋਮਜ਼ 22,40,87 (BWA, v.0.7.17-r1188, -a ਫਲੈਗ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ) ਮੈਪਿੰਗ ਦੁਆਰਾ ਮੈਪ ਕੀਤਾ ਗਿਆ ਸੀ।Eudormicrobiaceae ਜੀਨੋਮ.BAM ਫਾਈਲਾਂ ਨੂੰ 80% ਰੀਡ ਕਵਰੇਜ ਅਤੇ 95% ਪਛਾਣ ਫਿਲਟਰਿੰਗ ਤੋਂ ਬਾਅਦ FeatureCounts (v.2.0.1)88 ਨਾਲ ਸੰਸਾਧਿਤ ਕੀਤਾ ਗਿਆ ਸੀ (ਵਿਕਲਪ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਨਾਲ -ਪ੍ਰਾਇਮਰੀ -ਓ -ਫਰੈਕਸ਼ਨ -t CDS,tRNA -F GTF -g ID -p) ਦੀ ਗਿਣਤੀ ਕਰਦਾ ਹੈ। ਪ੍ਰਤੀ ਜੀਨ ਸੰਮਿਲਨਾਂ ਦੀ ਸੰਖਿਆ।ਤਿਆਰ ਕੀਤੇ ਨਕਸ਼ਿਆਂ ਨੂੰ ਜੀਨ ਦੀ ਲੰਬਾਈ ਅਤੇ ਮਾਰਕਰ ਜੀਨ ਭਰਪੂਰਤਾ ਐਮਓਟੀਯੂ (ਲੰਬਾਈ-ਸਧਾਰਨ ਔਸਤ ਸੰਮਿਲਨ ਗਿਣਤੀ>0 ਦੇ ਨਾਲ ਜੀਨਾਂ ਲਈ ਸੰਮਿਲਨ ਗਿਣਤੀ) ਲਈ ਸਧਾਰਣ ਕੀਤਾ ਗਿਆ ਸੀ ਅਤੇ ਹਰੇਕ ਜੀਨ ਪੱਧਰ ਦੇ ਪ੍ਰਤੀ ਸੈੱਲ ਅਨੁਸਾਰੀ ਸਮੀਕਰਨ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ 22.74 ਵਿੱਚ ਲੌਗ-ਤਬਦੀਲ ਕੀਤਾ ਗਿਆ ਸੀ, ਜੋ ਇਹ ਵੀ ਵਿਆਖਿਆ ਕਰਦਾ ਹੈ ਕ੍ਰਮ ਦੇ ਦੌਰਾਨ ਨਮੂਨੇ ਤੋਂ ਨਮੂਨੇ ਤੱਕ ਪਰਿਵਰਤਨਸ਼ੀਲਤਾ।ਅਜਿਹੇ ਅਨੁਪਾਤ ਤੁਲਨਾਤਮਕ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦੇ ਹਨ, ਤੁਲਨਾਤਮਕ ਭਰਪੂਰ ਡੇਟਾ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਸਮੇਂ ਰਚਨਾ ਦੀਆਂ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਘੱਟ ਕਰਦੇ ਹਨ।ਜੀਨੋਮ ਦੇ ਕਾਫ਼ੀ ਵੱਡੇ ਹਿੱਸੇ ਨੂੰ ਖੋਜਣ ਦੀ ਇਜਾਜ਼ਤ ਦੇਣ ਲਈ 10 ਐਮਓਟੀਯੂ ਮਾਰਕਰ ਜੀਨਾਂ ਵਿੱਚੋਂ 5 ਦੇ ਸਿਰਫ਼ ਨਮੂਨਿਆਂ ਨੂੰ ਹੀ ਹੋਰ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਵਿਚਾਰਿਆ ਗਿਆ ਸੀ।
'Ca ਦਾ ਸਧਾਰਣ ਟ੍ਰਾਂਸਕ੍ਰਿਪਟਮ ਪ੍ਰੋਫਾਈਲ।E. taraoceanii ਨੂੰ UMAP ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਅਯਾਮੀ ਕਮੀ ਦੇ ਅਧੀਨ ਕੀਤਾ ਗਿਆ ਸੀ ਅਤੇ ਨਤੀਜੇ ਵਜੋਂ ਪ੍ਰਤੀਨਿਧਤਾ ਸਮੀਕਰਨ ਸਥਿਤੀ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰਨ ਲਈ HDBSCAN (ਉੱਪਰ ਦੇਖੋ) ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਨਿਰੀਖਣ ਕੀਤੇ ਕਲੱਸਟਰਿੰਗ ਲਈ ਵਰਤੀ ਗਈ ਸੀ।ਪਰਮਾਨੋਵਾ ਮੂਲ (ਘੱਟ ਨਹੀਂ) ਦੂਰੀ ਸਪੇਸ ਵਿੱਚ ਪਛਾਣੇ ਗਏ ਕਲੱਸਟਰਾਂ ਵਿੱਚ ਅੰਤਰ ਦੀ ਮਹੱਤਤਾ ਦੀ ਜਾਂਚ ਕਰਦਾ ਹੈ।ਇਹਨਾਂ ਸ਼ਰਤਾਂ ਦੇ ਵਿਚਕਾਰ ਵਿਭਿੰਨ ਸਮੀਕਰਨ ਜੀਨੋਮ (ਉੱਪਰ ਦੇਖੋ) ਵਿੱਚ ਟੈਸਟ ਕੀਤਾ ਗਿਆ ਸੀ ਅਤੇ 201 ਕੇਈਜੀਜੀ ਮਾਰਗਾਂ ਨੂੰ 6 ਕਾਰਜਸ਼ੀਲ ਸਮੂਹਾਂ ਵਿੱਚ ਪਛਾਣਿਆ ਗਿਆ ਸੀ, ਅਰਥਾਤ: TXSSCAN ਤੋਂ BGC, secretion ਸਿਸਟਮ ਅਤੇ ਫਲੈਗੇਲਰ ਜੀਨ, ਡੀਗਰੇਡੇਸ਼ਨ ਐਨਜ਼ਾਈਮ (ਪ੍ਰੋਟੀਜ਼ ਅਤੇ ਪੇਪਟੀਡੇਸ), ਅਤੇ ਸ਼ਿਕਾਰੀ ਅਤੇ ਗੈਰ- ਸ਼ਿਕਾਰੀ ਜੀਨ.ਸ਼ਿਕਾਰੀ ਸੂਚਕਾਂਕ ਮਾਰਕਰ।ਹਰੇਕ ਨਮੂਨੇ ਲਈ, ਅਸੀਂ ਹਰੇਕ ਕਲਾਸ ਲਈ ਮੱਧਮਾਨ ਸਧਾਰਣ ਸਮੀਕਰਨ ਦੀ ਗਣਨਾ ਕੀਤੀ (ਨੋਟ ਕਰੋ ਕਿ BGC ਸਮੀਕਰਨ ਖੁਦ ਉਸ BGC ਲਈ ਬਾਇਓਸਿੰਥੈਟਿਕ ਜੀਨਾਂ ਦੇ ਮੱਧਮ ਸਮੀਕਰਨ ਵਜੋਂ ਗਿਣਿਆ ਜਾਂਦਾ ਹੈ) ਅਤੇ ਰਾਜਾਂ ਵਿੱਚ ਮਹੱਤਤਾ ਲਈ ਟੈਸਟ ਕੀਤਾ ਗਿਆ (FDR ਲਈ ਕਰਸਕਲ-ਵਾਲਿਸ ਟੈਸਟ ਐਡਜਸਟ ਕੀਤਾ ਗਿਆ)।
ਸਿੰਥੈਟਿਕ ਜੀਨ GenScript ਤੋਂ ਖਰੀਦੇ ਗਏ ਸਨ ਅਤੇ PCR ਪ੍ਰਾਈਮਰ ਮਾਈਕ੍ਰੋਸਿੰਥ ਤੋਂ ਖਰੀਦੇ ਗਏ ਸਨ।ਥਰਮੋ ਫਿਸ਼ਰ ਸਾਇੰਟਿਫਿਕ ਤੋਂ ਫਿਊਜ਼ਨ ਪੌਲੀਮੇਰੇਜ਼ ਦੀ ਵਰਤੋਂ ਡੀਐਨਏ ਐਂਪਲੀਫਿਕੇਸ਼ਨ ਲਈ ਕੀਤੀ ਗਈ ਸੀ।ਨਿਊਕਲੀਓਸਪਿਨ ਪਲਾਜ਼ਮੀਡ, ਨਿਊਕਲੀਓਸਪਿਨ ਜੈੱਲ ਅਤੇ ਮਾਚੇਰੀ-ਨਾਗੇਲ ਤੋਂ ਪੀਸੀਆਰ ਸ਼ੁੱਧੀਕਰਨ ਕਿੱਟ ਡੀਐਨਏ ਸ਼ੁੱਧਤਾ ਲਈ ਵਰਤੇ ਗਏ ਸਨ।ਪਾਬੰਦੀ ਐਨਜ਼ਾਈਮ ਅਤੇ T4 DNA ligase ਨਿਊ ਇੰਗਲੈਂਡ ਬਾਇਓਲੈਬਸ ਤੋਂ ਖਰੀਦੇ ਗਏ ਸਨ।isopropyl-β-d-1-thiogalactopyranoside (IPTG) (Biosynth) ਅਤੇ 1,4-dithiothreitol (DTT, AppliChem) ਤੋਂ ਇਲਾਵਾ ਹੋਰ ਰਸਾਇਣ ਸਿਗਮਾ-ਐਲਡਰਿਕ ਤੋਂ ਖਰੀਦੇ ਗਏ ਸਨ ਅਤੇ ਬਿਨਾਂ ਹੋਰ ਸ਼ੁੱਧਤਾ ਦੇ ਵਰਤੇ ਗਏ ਸਨ।ਐਂਟੀਬਾਇਓਟਿਕਸ ਕਲੋਰਾਮਫੇਨਿਕੋਲ (ਸੀ. ਐੱਮ.), ਸਪੈਕਟੀਨੋਮਾਈਸਿਨ ਡਾਈਹਾਈਡ੍ਰੋਕਲੋਰਾਈਡ (ਐੱਸ.ਐੱਮ.), ਐਂਪਿਸਿਲਿਨ (ਐਂਪੀ), ਜੈਂਟਾਮਾਇਸਿਨ (ਜੀਟੀ), ਅਤੇ ਕਾਰਬੇਨਿਸਿਲਿਨ (ਸੀਬੀਐਨ) ਐਪਲੀਕੇਮ ਤੋਂ ਖਰੀਦੇ ਗਏ ਸਨ।ਬੈਕਟੋ ਟ੍ਰਿਪਟੋਨ ਅਤੇ ਬੈਕਟੋ ਯੀਸਟ ਐਕਸਟਰੈਕਟ ਮੀਡੀਆ ਕੰਪੋਨੈਂਟਸ ਬੀਡੀ ਬਾਇਓਸਾਇੰਸ ਤੋਂ ਖਰੀਦੇ ਗਏ ਸਨ।ਤਰਤੀਬ ਲਈ ਟ੍ਰਾਈਪਸਿਨ ਪ੍ਰੋਮੇਗਾ ਤੋਂ ਖਰੀਦੀ ਗਈ ਸੀ।
ਜੀਨ ਕ੍ਰਮ ਵਿਰੋਧੀ SMASH ਭਵਿੱਖਬਾਣੀ BGC 75.1 ਤੋਂ ਕੱਢੇ ਗਏ ਸਨ।E. malaspinii (ਪੂਰਕ ਜਾਣਕਾਰੀ)।
ਜੀਨ embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4), ਅਤੇ embAM (ਇੰਟਰਜੀਨ ਖੇਤਰਾਂ ਸਮੇਤ) ਬਿਨਾਂ ਕ੍ਰਮਬੱਧ (pU5Cdon) ਦੇ ਨਾਲ ਸੰਰਚਨਾ ਦੇ ਰੂਪ ਵਿੱਚ ਸਮਕਾਲੀ ਅਤੇ ਸਹਿ-ਸਹਿਯੋਗ ਦੇ ਰੂਪ ਵਿੱਚ ਸਨ। s ਨੂੰ E ਵਿੱਚ ਪ੍ਰਗਟਾਵੇ ਲਈ ਅਨੁਕੂਲ ਬਣਾਇਆ ਗਿਆ ਹੈ ਜਦੋਂ.EmA ਜੀਨ ਨੂੰ PACYCDuet-1(CmR) ਅਤੇ pCDFDuet-1(SmR) ਦੀ ਪਹਿਲੀ ਮਲਟੀਪਲ ਕਲੋਨਿੰਗ ਸਾਈਟ (MCS1) ਵਿੱਚ BamHI ਅਤੇ HindIII ਕਲੀਵੇਜ ਸਾਈਟਾਂ ਨਾਲ ਸਬਕਲੋਨ ਕੀਤਾ ਗਿਆ ਸੀ।embM ਅਤੇ embMopt ਜੀਨਾਂ (ਕੋਡੋਨ-ਅਨੁਕੂਲਿਤ) ਨੂੰ MCS1 pCDFDuet-1(SmR) ਵਿੱਚ BamHI ਅਤੇ HindIII ਦੇ ਨਾਲ ਸਬਕਲੋਨ ਕੀਤਾ ਗਿਆ ਸੀ ਅਤੇ pCDFDuet-1 (SmR) ਅਤੇ pRSFDuet-1 (KanR) (MCS2) ਦੀ ਦੂਜੀ ਮਲਟੀਪਲ ਕਲੋਨਿੰਗ ਸਾਈਟ ਵਿੱਚ ਰੱਖਿਆ ਗਿਆ ਸੀ। NdeI/ChoI।embAM ਕੈਸੇਟ ਨੂੰ BamHI ਅਤੇ HindIII ਕਲੀਵੇਜ ਸਾਈਟਾਂ ਦੇ ਨਾਲ pCDFDuet1(SmR) ਵਿੱਚ ਸਬਕਲੋਨ ਕੀਤਾ ਗਿਆ ਸੀ।orf3/embI ਜੀਨ (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) ਨੂੰ ਓਵਰਲੈਪ ਐਕਸਟੈਂਸ਼ਨ ਪੀਸੀਆਰ ਦੁਆਰਾ EmbI_OE_F_NdeI ਅਤੇ EmbI_OE_R_XhoI, ਪ੍ਰਾਈਮਰਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਬਣਾਇਆ ਗਿਆ ਸੀ, ਜੋ ਕਿ NdeM-1-121000000000000000000000 ਤੱਕ ) ਸਮਾਨ ਪਾਬੰਦੀ ਐਨਜ਼ਾਈਮ (ਪੂਰਕ ਸਾਰਣੀ).6).ਪਾਬੰਦੀ ਐਂਜ਼ਾਈਮ ਪਾਚਨ ਅਤੇ ਬੰਧਨ ਨਿਰਮਾਤਾ ਦੇ ਪ੍ਰੋਟੋਕੋਲ (ਨਿਊ ਇੰਗਲੈਂਡ ਬਾਇਓਲੈਬਸ) ਦੇ ਅਨੁਸਾਰ ਕੀਤਾ ਗਿਆ ਸੀ।

 


ਪੋਸਟ ਟਾਈਮ: ਮਾਰਚ-14-2023