"ವಿಶ್ವದ ಅತ್ಯಂತ ಬುದ್ಧಿವಂತ" Grok3 ಅನ್ನು ಪರೀಕ್ಷಿಸಲಾಗುತ್ತಿದೆ

ಐಪು ವಾಟನ್ ಗ್ರೂಪ್ (1)

ಪರಿಚಯ

ಪೂರ್ವ ತರಬೇತಿ ಪಡೆದ ಮಾದರಿಗಳಿಗೆ Grok3 "ಅಂತ್ಯಬಿಂದು" ಎಂದು ನೀವು ಭಾವಿಸುತ್ತೀರಾ?

ಎಲಾನ್ ಮಸ್ಕ್ ಮತ್ತು xAI ತಂಡವು ಅಧಿಕೃತವಾಗಿ ಗ್ರೋಕ್‌ನ ಇತ್ತೀಚಿನ ಆವೃತ್ತಿಯಾದ ಗ್ರೋಕ್3 ಅನ್ನು ಲೈವ್‌ಸ್ಟ್ರೀಮ್ ಸಮಯದಲ್ಲಿ ಬಿಡುಗಡೆ ಮಾಡಿತು. ಈ ಕಾರ್ಯಕ್ರಮಕ್ಕೂ ಮೊದಲು, ಮಸ್ಕ್‌ನ 24/7 ಪ್ರಚಾರದ ಪ್ರಚಾರದೊಂದಿಗೆ ಸೇರಿಕೊಂಡು ಗಮನಾರ್ಹ ಪ್ರಮಾಣದ ಸಂಬಂಧಿತ ಮಾಹಿತಿಯು Grok3 ಗಾಗಿ ಜಾಗತಿಕ ನಿರೀಕ್ಷೆಗಳನ್ನು ಅಭೂತಪೂರ್ವ ಮಟ್ಟಕ್ಕೆ ಏರಿಸಿತು. ಕೇವಲ ಒಂದು ವಾರದ ಹಿಂದೆ, ಮಸ್ಕ್ ಡೀಪ್‌ಸೀಕ್ R1 ನಲ್ಲಿ ಕಾಮೆಂಟ್ ಮಾಡುವಾಗ ಲೈವ್‌ಸ್ಟ್ರೀಮ್ ಸಮಯದಲ್ಲಿ ಆತ್ಮವಿಶ್ವಾಸದಿಂದ ಹೇಳಿದ್ದು, "xAI ಉತ್ತಮ AI ಮಾದರಿಯನ್ನು ಪ್ರಾರಂಭಿಸಲಿದೆ." ಲೈವ್‌ನಲ್ಲಿ ಪ್ರಸ್ತುತಪಡಿಸಿದ ಡೇಟಾದಿಂದ, Grok3 ಗಣಿತ, ವಿಜ್ಞಾನ ಮತ್ತು ಪ್ರೋಗ್ರಾಮಿಂಗ್‌ಗಾಗಿ ಮಾನದಂಡಗಳಲ್ಲಿ ಎಲ್ಲಾ ಪ್ರಸ್ತುತ ಮುಖ್ಯವಾಹಿನಿಯ ಮಾದರಿಗಳನ್ನು ಮೀರಿಸಿದೆ ಎಂದು ವರದಿಯಾಗಿದೆ, ಸ್ಪೇಸ್‌ಎಕ್ಸ್‌ನ ಮಂಗಳ ಗ್ರಹ ಕಾರ್ಯಾಚರಣೆಗಳಿಗೆ ಸಂಬಂಧಿಸಿದ ಕಂಪ್ಯೂಟೇಶನಲ್ ಕಾರ್ಯಗಳಿಗೆ Grok3 ಅನ್ನು ಬಳಸಲಾಗುವುದು ಎಂದು ಮಸ್ಕ್ ಹೇಳಿಕೊಂಡಿದ್ದಾರೆ, "ಮೂರು ವರ್ಷಗಳಲ್ಲಿ ನೊಬೆಲ್ ಪ್ರಶಸ್ತಿ ಮಟ್ಟದಲ್ಲಿ ಪ್ರಗತಿಗಳನ್ನು" ಊಹಿಸುತ್ತಾರೆ. ಆದಾಗ್ಯೂ, ಇವು ಪ್ರಸ್ತುತ ಮಸ್ಕ್‌ನ ಪ್ರತಿಪಾದನೆಗಳು ಮಾತ್ರ. ಬಿಡುಗಡೆಯ ನಂತರ, ನಾನು Grok3 ನ ಇತ್ತೀಚಿನ ಬೀಟಾ ಆವೃತ್ತಿಯನ್ನು ಪರೀಕ್ಷಿಸಿದೆ ಮತ್ತು ದೊಡ್ಡ ಮಾದರಿಗಳಿಗೆ ಕ್ಲಾಸಿಕ್ ಟ್ರಿಕ್ ಪ್ರಶ್ನೆಯನ್ನು ಮುಂದಿಟ್ಟಿದ್ದೇನೆ: "ಯಾವುದು ದೊಡ್ಡದು, 9.11 ಅಥವಾ 9.9?" ವಿಷಾದಕರವೆಂದರೆ, ಯಾವುದೇ ಅರ್ಹತೆಗಳು ಅಥವಾ ಗುರುತುಗಳಿಲ್ಲದೆ, ಬುದ್ಧಿವಂತ ಗ್ರೋಕ್3 ಎಂದು ಕರೆಯಲ್ಪಡುವವರು ಇನ್ನೂ ಈ ಪ್ರಶ್ನೆಗೆ ಸರಿಯಾಗಿ ಉತ್ತರಿಸಲು ಸಾಧ್ಯವಾಗಲಿಲ್ಲ. ಪ್ರಶ್ನೆಯ ಅರ್ಥವನ್ನು ನಿಖರವಾಗಿ ಗುರುತಿಸುವಲ್ಲಿ ಗ್ರೋಕ್3 ವಿಫಲವಾಗಿದೆ.

 

ಈ ಪರೀಕ್ಷೆಯು ಅನೇಕ ಸ್ನೇಹಿತರಿಂದ ಗಣನೀಯ ಗಮನ ಸೆಳೆಯಿತು, ಮತ್ತು ಕಾಕತಾಳೀಯವಾಗಿ, ವಿದೇಶಗಳಲ್ಲಿ ಇದೇ ರೀತಿಯ ವಿವಿಧ ಪರೀಕ್ಷೆಗಳು Grok3 "ಪಿಸಾದ ಲೀನಿಂಗ್ ಟವರ್‌ನಿಂದ ಯಾವ ಚೆಂಡು ಮೊದಲು ಬೀಳುತ್ತದೆ?" ನಂತಹ ಮೂಲಭೂತ ಭೌತಶಾಸ್ತ್ರ/ಗಣಿತದ ಪ್ರಶ್ನೆಗಳೊಂದಿಗೆ ಹೋರಾಡುತ್ತಿರುವುದನ್ನು ತೋರಿಸಿವೆ. ಹೀಗಾಗಿ, ಇದನ್ನು "ಸರಳ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರಿಸಲು ಇಷ್ಟವಿಲ್ಲದ ಪ್ರತಿಭೆ" ಎಂದು ಹಾಸ್ಯಮಯವಾಗಿ ಲೇಬಲ್ ಮಾಡಲಾಗಿದೆ.

640

Grok3 ಒಳ್ಳೆಯದು, ಆದರೆ ಅದು R1 ಅಥವಾ o1-Pro ಗಿಂತ ಉತ್ತಮವಲ್ಲ.

ಪ್ರಾಯೋಗಿಕವಾಗಿ ಅನೇಕ ಸಾಮಾನ್ಯ ಜ್ಞಾನ ಪರೀಕ್ಷೆಗಳಲ್ಲಿ Grok3 "ವೈಫಲ್ಯಗಳನ್ನು" ಅನುಭವಿಸಿತು. xAI ಉಡಾವಣಾ ಕಾರ್ಯಕ್ರಮದ ಸಮಯದಲ್ಲಿ, ಮಸ್ಕ್ ಪಾತ್ ಆಫ್ ಎಕ್ಸೈಲ್ 2 ಆಟದ ಪಾತ್ರ ವರ್ಗಗಳು ಮತ್ತು ಪರಿಣಾಮಗಳನ್ನು ವಿಶ್ಲೇಷಿಸಲು Grok3 ಅನ್ನು ಪ್ರದರ್ಶಿಸಿದರು, ಅದನ್ನು ಅವರು ಆಗಾಗ್ಗೆ ಆಡುವುದಾಗಿ ಹೇಳಿಕೊಂಡರು, ಆದರೆ Grok3 ಒದಗಿಸಿದ ಹೆಚ್ಚಿನ ಉತ್ತರಗಳು ತಪ್ಪಾಗಿದ್ದವು. ಲೈವ್‌ಸ್ಟ್ರೀಮ್ ಸಮಯದಲ್ಲಿ ಮಸ್ಕ್ ಈ ಸ್ಪಷ್ಟ ಸಮಸ್ಯೆಯನ್ನು ಗಮನಿಸಲಿಲ್ಲ.

 

ಈ ತಪ್ಪು ವಿದೇಶಿ ನೆಟಿಜನ್‌ಗಳು ಗೇಮಿಂಗ್‌ನಲ್ಲಿ "ಬದಲಿಯನ್ನು ಕಂಡುಕೊಂಡಿದ್ದಕ್ಕಾಗಿ" ಮಸ್ಕ್ ಅವರನ್ನು ಅಪಹಾಸ್ಯ ಮಾಡಲು ಮತ್ತಷ್ಟು ಪುರಾವೆಗಳನ್ನು ಒದಗಿಸಿದ್ದಲ್ಲದೆ, ಪ್ರಾಯೋಗಿಕ ಅನ್ವಯಿಕೆಗಳಲ್ಲಿ Grok3 ನ ವಿಶ್ವಾಸಾರ್ಹತೆಯ ಬಗ್ಗೆ ಗಮನಾರ್ಹ ಕಳವಳಗಳನ್ನು ಹುಟ್ಟುಹಾಕಿತು. ಅಂತಹ "ಪ್ರತಿಭೆ" ಗಾಗಿ, ಅದರ ನಿಜವಾದ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಲೆಕ್ಕಿಸದೆ, ಮಂಗಳ ಪರಿಶೋಧನಾ ಕಾರ್ಯಗಳಂತಹ ಅತ್ಯಂತ ಸಂಕೀರ್ಣ ಅನ್ವಯಿಕ ಸನ್ನಿವೇಶಗಳಲ್ಲಿ ಅದರ ವಿಶ್ವಾಸಾರ್ಹತೆಯು ಸಂದೇಹದಲ್ಲಿದೆ.

 

ಪ್ರಸ್ತುತ, ವಾರಗಳ ಹಿಂದೆ Grok3 ಗೆ ಪ್ರವೇಶ ಪಡೆದ ಅನೇಕ ಪರೀಕ್ಷಕರು ಮತ್ತು ನಿನ್ನೆ ಕೆಲವು ಗಂಟೆಗಳ ಕಾಲ ಮಾದರಿ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಪರೀಕ್ಷಿಸಿದವರು ಎಲ್ಲರೂ ಸಾಮಾನ್ಯ ತೀರ್ಮಾನವನ್ನು ಸೂಚಿಸುತ್ತಾರೆ: "Grok3 ಒಳ್ಳೆಯದು, ಆದರೆ ಇದು R1 ಅಥವಾ o1-Pro ಗಿಂತ ಉತ್ತಮವಾಗಿಲ್ಲ."

640 (1)

"ಎನ್ವಿಡಿಯಾವನ್ನು ಅಡ್ಡಿಪಡಿಸುವುದು" ಕುರಿತು ಒಂದು ವಿಮರ್ಶಾತ್ಮಕ ದೃಷ್ಟಿಕೋನ

ಬಿಡುಗಡೆಯ ಸಮಯದಲ್ಲಿ ಅಧಿಕೃತವಾಗಿ ಪ್ರಸ್ತುತಪಡಿಸಲಾದ PPT ಯಲ್ಲಿ, Grok3 ಅನ್ನು ಚಾಟ್‌ಬಾಟ್ ಅರೆನಾದಲ್ಲಿ "ತುಂಬಾ ಮುಂದಿದೆ" ಎಂದು ತೋರಿಸಲಾಗಿದೆ, ಆದರೆ ಇದು ಜಾಣತನದಿಂದ ಗ್ರಾಫಿಕ್ ತಂತ್ರಗಳನ್ನು ಬಳಸಿದೆ: ಲೀಡರ್‌ಬೋರ್ಡ್‌ನಲ್ಲಿರುವ ಲಂಬ ಅಕ್ಷವು 1400-1300 ಸ್ಕೋರ್ ಶ್ರೇಣಿಯಲ್ಲಿ ಮಾತ್ರ ಫಲಿತಾಂಶಗಳನ್ನು ಪಟ್ಟಿ ಮಾಡಿದೆ, ಇದರಿಂದಾಗಿ ಪರೀಕ್ಷಾ ಫಲಿತಾಂಶಗಳಲ್ಲಿನ ಮೂಲ 1% ವ್ಯತ್ಯಾಸವು ಈ ಪ್ರಸ್ತುತಿಯಲ್ಲಿ ಅಸಾಧಾರಣವಾಗಿ ಗಮನಾರ್ಹವಾಗಿ ಕಂಡುಬರುತ್ತದೆ.

640

ನಿಜವಾದ ಮಾದರಿ ಸ್ಕೋರಿಂಗ್ ಫಲಿತಾಂಶಗಳಲ್ಲಿ, Grok3 DeepSeek R1 ಮತ್ತು GPT-4.0 ಗಿಂತ ಕೇವಲ 1-2% ಮುಂದಿದೆ, ಇದು ಪ್ರಾಯೋಗಿಕ ಪರೀಕ್ಷೆಗಳಲ್ಲಿ ಅನೇಕ ಬಳಕೆದಾರರ ಅನುಭವಗಳಿಗೆ ಅನುಗುಣವಾಗಿದೆ, ಇದರಲ್ಲಿ "ಗಮನಾರ್ಹ ವ್ಯತ್ಯಾಸವಿಲ್ಲ" ಎಂದು ಕಂಡುಬಂದಿದೆ. Grok3 ತನ್ನ ಉತ್ತರಾಧಿಕಾರಿಗಳನ್ನು 1%-2% ರಷ್ಟು ಮಾತ್ರ ಮೀರಿಸುತ್ತದೆ.

640

Grok3 ಪ್ರಸ್ತುತ ಸಾರ್ವಜನಿಕವಾಗಿ ಪರೀಕ್ಷಿಸಲಾದ ಎಲ್ಲಾ ಮಾದರಿಗಳಿಗಿಂತ ಹೆಚ್ಚಿನ ಅಂಕಗಳನ್ನು ಗಳಿಸಿದ್ದರೂ, ಅನೇಕರು ಇದನ್ನು ಗಂಭೀರವಾಗಿ ಪರಿಗಣಿಸುವುದಿಲ್ಲ: ಎಲ್ಲಾ ನಂತರ, xAI ಅನ್ನು Grok2 ಯುಗದಲ್ಲಿ "ಸ್ಕೋರ್ ಮ್ಯಾನಿಪ್ಯುಲೇಷನ್" ಗಾಗಿ ಹಿಂದೆ ಟೀಕಿಸಲಾಗಿತ್ತು. ಲೀಡರ್‌ಬೋರ್ಡ್ ಉತ್ತರ ಉದ್ದದ ಶೈಲಿಯನ್ನು ದಂಡಿಸಿದಂತೆ, ಅಂಕಗಳು ಬಹಳ ಕಡಿಮೆಯಾದವು, ಇದು ಉದ್ಯಮದ ಒಳಗಿನವರು "ಹೆಚ್ಚಿನ ಅಂಕಗಳನ್ನು ಗಳಿಸುವ ಆದರೆ ಕಡಿಮೆ ಸಾಮರ್ಥ್ಯ"ದ ವಿದ್ಯಮಾನವನ್ನು ಹೆಚ್ಚಾಗಿ ಟೀಕಿಸಲು ಕಾರಣವಾಯಿತು.

 

ಲೀಡರ್‌ಬೋರ್ಡ್ "ಮ್ಯಾನಿಪ್ಯುಲೇಷನ್" ಮೂಲಕವಾಗಲಿ ಅಥವಾ ವಿವರಣೆಗಳಲ್ಲಿ ವಿನ್ಯಾಸ ತಂತ್ರಗಳ ಮೂಲಕವಾಗಲಿ, ಅವು xAI ಮತ್ತು ಮಾದರಿ ಸಾಮರ್ಥ್ಯಗಳಲ್ಲಿ "ಪ್ಯಾಕ್ ಅನ್ನು ಮುನ್ನಡೆಸುವ" ಕಲ್ಪನೆಯೊಂದಿಗೆ ಮಸ್ಕ್‌ನ ಗೀಳನ್ನು ಬಹಿರಂಗಪಡಿಸುತ್ತವೆ. ಈ ಅಂಚುಗಳಿಗೆ ಮಸ್ಕ್ ಭಾರಿ ಬೆಲೆಯನ್ನು ಪಾವತಿಸಿದರು: ಬಿಡುಗಡೆಯ ಸಮಯದಲ್ಲಿ, ಅವರು 200,000 H100 GPU ಗಳನ್ನು ಬಳಸಿದ್ದಾರೆ (ಲೈವ್‌ಸ್ಟ್ರೀಮ್ ಸಮಯದಲ್ಲಿ "100,000 ಕ್ಕೂ ಹೆಚ್ಚು" ಎಂದು ಹೇಳಿಕೊಳ್ಳುತ್ತಾರೆ) ಮತ್ತು ಒಟ್ಟು 200 ಮಿಲಿಯನ್ ಗಂಟೆಗಳ ತರಬೇತಿ ಸಮಯವನ್ನು ಸಾಧಿಸಿದ್ದಾರೆ ಎಂದು ಹೆಮ್ಮೆಪಡುತ್ತಾರೆ. ಇದು GPU ಉದ್ಯಮಕ್ಕೆ ಮತ್ತೊಂದು ಮಹತ್ವದ ವರದಾನವನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತದೆ ಎಂದು ಕೆಲವರು ನಂಬಲು ಮತ್ತು ವಲಯದ ಮೇಲೆ DeepSeek ನ ಪ್ರಭಾವವನ್ನು "ಮೂರ್ಖತನ" ಎಂದು ಪರಿಗಣಿಸಲು ಕಾರಣವಾಯಿತು. ಗಮನಾರ್ಹವಾಗಿ, ಕೆಲವರು ಸಂಪೂರ್ಣ ಕಂಪ್ಯೂಟೇಶನಲ್ ಶಕ್ತಿಯು ಮಾದರಿ ತರಬೇತಿಯ ಭವಿಷ್ಯವಾಗಿರುತ್ತದೆ ಎಂದು ನಂಬುತ್ತಾರೆ.

 

ಆದಾಗ್ಯೂ, ಕೆಲವು ನೆಟಿಜನ್‌ಗಳು DeepSeek V3 ಅನ್ನು ಉತ್ಪಾದಿಸಲು ಎರಡು ತಿಂಗಳುಗಳಲ್ಲಿ 2000 H800 GPU ಗಳ ಬಳಕೆಯನ್ನು ಹೋಲಿಸಿದರು, Grok3 ನ ನಿಜವಾದ ತರಬೇತಿ ವಿದ್ಯುತ್ ಬಳಕೆ V3 ಗಿಂತ 263 ಪಟ್ಟು ಎಂದು ಲೆಕ್ಕಹಾಕಿದರು. 1402 ಅಂಕಗಳನ್ನು ಗಳಿಸಿದ DeepSeek V3 ಮತ್ತು Grok3 ನಡುವಿನ ಅಂತರವು 100 ಅಂಕಗಳಿಗಿಂತ ಸ್ವಲ್ಪ ಕಡಿಮೆಯಾಗಿದೆ. ಈ ಡೇಟಾ ಬಿಡುಗಡೆಯಾದ ನಂತರ, Grok3 ನ "ವಿಶ್ವದ ಪ್ರಬಲ" ಶೀರ್ಷಿಕೆಯ ಹಿಂದೆ ಸ್ಪಷ್ಟವಾದ ಕನಿಷ್ಠ ಉಪಯುಕ್ತತೆಯ ಪರಿಣಾಮವಿದೆ ಎಂದು ಹಲವರು ಬೇಗನೆ ಅರಿತುಕೊಂಡರು - ಬಲವಾದ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಉತ್ಪಾದಿಸುವ ದೊಡ್ಡ ಮಾದರಿಗಳ ತರ್ಕವು ಕಡಿಮೆಯಾಗುತ್ತಿರುವ ಆದಾಯವನ್ನು ತೋರಿಸಲು ಪ್ರಾರಂಭಿಸಿದೆ.

640 (2)

"ಹೆಚ್ಚಿನ ಸ್ಕೋರಿಂಗ್ ಆದರೆ ಕಡಿಮೆ ಸಾಮರ್ಥ್ಯ" ಹೊಂದಿದ್ದರೂ ಸಹ, ಬಳಕೆಯನ್ನು ಬೆಂಬಲಿಸಲು Grok2 X (ಟ್ವಿಟರ್) ಪ್ಲಾಟ್‌ಫಾರ್ಮ್‌ನಿಂದ ಹೆಚ್ಚಿನ ಪ್ರಮಾಣದ ಉತ್ತಮ-ಗುಣಮಟ್ಟದ ಪ್ರಥಮ-ಪಕ್ಷದ ಡೇಟಾವನ್ನು ಹೊಂದಿತ್ತು. ಆದಾಗ್ಯೂ, Grok3 ನ ತರಬೇತಿಯಲ್ಲಿ, xAI ಸ್ವಾಭಾವಿಕವಾಗಿ OpenAI ಪ್ರಸ್ತುತ ಎದುರಿಸುತ್ತಿರುವ "ಸೀಲಿಂಗ್" ಅನ್ನು ಎದುರಿಸಿತು - ಪ್ರೀಮಿಯಂ ತರಬೇತಿ ಡೇಟಾದ ಕೊರತೆಯು ಮಾದರಿಯ ಸಾಮರ್ಥ್ಯಗಳ ಕನಿಷ್ಠ ಉಪಯುಕ್ತತೆಯನ್ನು ತ್ವರಿತವಾಗಿ ಬಹಿರಂಗಪಡಿಸುತ್ತದೆ.

 

ಗ್ರೋಕ್3 ಮತ್ತು ಮಸ್ಕ್‌ನ ಡೆವಲಪರ್‌ಗಳು ಈ ಸಂಗತಿಗಳನ್ನು ಆಳವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಂಡ ಮತ್ತು ಗುರುತಿಸಿದವರಲ್ಲಿ ಮೊದಲಿಗರಾಗಿರಬಹುದು, ಅದಕ್ಕಾಗಿಯೇ ಮಸ್ಕ್ ಸಾಮಾಜಿಕ ಮಾಧ್ಯಮದಲ್ಲಿ ಬಳಕೆದಾರರು ಈಗ ಅನುಭವಿಸುತ್ತಿರುವ ಆವೃತ್ತಿ "ಇನ್ನೂ ಬೀಟಾ ಮಾತ್ರ" ಮತ್ತು "ಪೂರ್ಣ ಆವೃತ್ತಿಯನ್ನು ಮುಂಬರುವ ತಿಂಗಳುಗಳಲ್ಲಿ ಬಿಡುಗಡೆ ಮಾಡಲಾಗುವುದು" ಎಂದು ನಿರಂತರವಾಗಿ ಉಲ್ಲೇಖಿಸಿದ್ದಾರೆ. ಮಸ್ಕ್ ಗ್ರೋಕ್3 ನ ಉತ್ಪನ್ನ ನಿರ್ವಾಹಕನ ಪಾತ್ರವನ್ನು ವಹಿಸಿಕೊಂಡಿದ್ದಾರೆ, ಕಾಮೆಂಟ್‌ಗಳ ವಿಭಾಗದಲ್ಲಿ ಎದುರಾಗುವ ವಿವಿಧ ಸಮಸ್ಯೆಗಳ ಕುರಿತು ಬಳಕೆದಾರರು ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ಒದಗಿಸುವಂತೆ ಸೂಚಿಸಿದ್ದಾರೆ. ಅವರು ಭೂಮಿಯ ಮೇಲೆ ಹೆಚ್ಚು ಅನುಸರಿಸುವ ಉತ್ಪನ್ನ ನಿರ್ವಾಹಕರಾಗಿರಬಹುದು.

 

ಆದರೂ, ಒಂದು ದಿನದೊಳಗೆ, Grok3 ನ ಕಾರ್ಯಕ್ಷಮತೆಯು ನಿಸ್ಸಂದೇಹವಾಗಿ ಬಲವಾದ ದೊಡ್ಡ ಮಾದರಿಗಳಿಗೆ ತರಬೇತಿ ನೀಡಲು "ಬೃಹತ್ ಕಂಪ್ಯೂಟೇಶನಲ್ ಸ್ನಾಯು"ವನ್ನು ಅವಲಂಬಿಸಲು ಆಶಿಸುವವರಿಗೆ ಎಚ್ಚರಿಕೆಯನ್ನು ಮೂಡಿಸಿತು: ಸಾರ್ವಜನಿಕವಾಗಿ ಲಭ್ಯವಿರುವ ಮೈಕ್ರೋಸಾಫ್ಟ್ ಮಾಹಿತಿಯ ಆಧಾರದ ಮೇಲೆ, OpenAI ನ GPT-4 1.8 ಟ್ರಿಲಿಯನ್ ನಿಯತಾಂಕಗಳ ನಿಯತಾಂಕ ಗಾತ್ರವನ್ನು ಹೊಂದಿದೆ, ಇದು GPT-3 ಗಿಂತ ಹತ್ತು ಪಟ್ಟು ಹೆಚ್ಚು. GPT-4.5 ನ ನಿಯತಾಂಕ ಗಾತ್ರವು ಇನ್ನೂ ದೊಡ್ಡದಾಗಿರಬಹುದು ಎಂದು ವದಂತಿಗಳು ಸೂಚಿಸುತ್ತವೆ.

 

ಮಾದರಿ ನಿಯತಾಂಕ ಗಾತ್ರಗಳು ಗಗನಕ್ಕೇರುತ್ತಿದ್ದಂತೆ, ತರಬೇತಿ ವೆಚ್ಚಗಳು ಸಹ ಗಗನಕ್ಕೇರುತ್ತಿವೆ. Grok3 ನ ಉಪಸ್ಥಿತಿಯೊಂದಿಗೆ, ನಿಯತಾಂಕ ಗಾತ್ರದ ಮೂಲಕ ಉತ್ತಮ ಮಾದರಿ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಸಾಧಿಸಲು "ಹಣವನ್ನು ಸುಡುವುದನ್ನು" ಮುಂದುವರಿಸಲು ಬಯಸುವ GPT-4.5 ಮತ್ತು ಇತರ ಸ್ಪರ್ಧಿಗಳು ಈಗ ಸ್ಪಷ್ಟವಾಗಿ ಗೋಚರಿಸುವ ಮಿತಿಯನ್ನು ಪರಿಗಣಿಸಬೇಕು ಮತ್ತು ಅದನ್ನು ಹೇಗೆ ಜಯಿಸುವುದು ಎಂದು ಯೋಚಿಸಬೇಕು. ಈ ಕ್ಷಣದಲ್ಲಿ, ಓಪನ್‌ಎಐನ ಮಾಜಿ ಮುಖ್ಯ ವಿಜ್ಞಾನಿ ಇಲ್ಯಾ ಸಟ್ಸ್‌ಕೆವರ್ ಕಳೆದ ಡಿಸೆಂಬರ್‌ನಲ್ಲಿ "ನಮಗೆ ಪರಿಚಿತವಾಗಿರುವ ಪೂರ್ವ-ತರಬೇತಿ ಕೊನೆಗೊಳ್ಳುತ್ತದೆ" ಎಂದು ಹೇಳಿದ್ದರು, ಇದು ಚರ್ಚೆಗಳಲ್ಲಿ ಮತ್ತೆ ಕಾಣಿಸಿಕೊಂಡಿದೆ, ದೊಡ್ಡ ಮಾದರಿಗಳಿಗೆ ತರಬೇತಿ ನೀಡುವ ನಿಜವಾದ ಮಾರ್ಗವನ್ನು ಕಂಡುಕೊಳ್ಳುವ ಪ್ರಯತ್ನಗಳನ್ನು ಪ್ರೇರೇಪಿಸಿದೆ.

640 (3)

ಇಲ್ಯಾ ಅವರ ದೃಷ್ಟಿಕೋನವು ಉದ್ಯಮದಲ್ಲಿ ಎಚ್ಚರಿಕೆಯ ಗಂಟೆ ಬಾರಿಸಿದೆ. ಪ್ರವೇಶಿಸಬಹುದಾದ ಹೊಸ ದತ್ತಾಂಶದ ಸನ್ನಿಹಿತ ಬಳಲಿಕೆಯನ್ನು ಅವರು ನಿಖರವಾಗಿ ಮುನ್ಸೂಚಿಸಿದರು, ಇದು ದತ್ತಾಂಶ ಸ್ವಾಧೀನದ ಮೂಲಕ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಹೆಚ್ಚಿಸಲು ಸಾಧ್ಯವಾಗದ ಪರಿಸ್ಥಿತಿಗೆ ಕಾರಣವಾಗುತ್ತದೆ, ಅದನ್ನು ಪಳೆಯುಳಿಕೆ ಇಂಧನಗಳ ಬಳಲಿಕೆಗೆ ಹೋಲಿಸಿದರು. "ತೈಲದಂತೆ, ಇಂಟರ್ನೆಟ್‌ನಲ್ಲಿ ಮಾನವ-ರಚಿತ ವಿಷಯವು ಸೀಮಿತ ಸಂಪನ್ಮೂಲವಾಗಿದೆ" ಎಂದು ಅವರು ಸೂಚಿಸಿದರು. ಸಟ್ಸ್‌ಕೆವರ್ ಅವರ ಭವಿಷ್ಯವಾಣಿಗಳಲ್ಲಿ, ಮುಂದಿನ ಪೀಳಿಗೆಯ ಮಾದರಿಗಳು, ಪೂರ್ವ-ತರಬೇತಿಯ ನಂತರ, "ನಿಜವಾದ ಸ್ವಾಯತ್ತತೆ" ಮತ್ತು "ಮಾನವ ಮೆದುಳಿಗೆ ಹೋಲುವ" ತಾರ್ಕಿಕ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಹೊಂದಿರುತ್ತವೆ.

 

ಇಂದಿನ ಪೂರ್ವ-ತರಬೇತಿ ಪಡೆದ ಮಾದರಿಗಳಿಗಿಂತ ಭಿನ್ನವಾಗಿ, ಪ್ರಾಥಮಿಕವಾಗಿ ವಿಷಯ ಹೊಂದಾಣಿಕೆಯನ್ನು (ಹಿಂದೆ ಕಲಿತ ಮಾದರಿ ವಿಷಯವನ್ನು ಆಧರಿಸಿ) ಅವಲಂಬಿಸಿರುತ್ತವೆ, ಭವಿಷ್ಯದ AI ವ್ಯವಸ್ಥೆಗಳು ಮಾನವ ಮೆದುಳಿನ "ಚಿಂತನೆ"ಯಂತೆಯೇ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸಲು ವಿಧಾನಗಳನ್ನು ಕಲಿಯಲು ಮತ್ತು ಸ್ಥಾಪಿಸಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ. ಮೂಲಭೂತ ವೃತ್ತಿಪರ ಸಾಹಿತ್ಯದೊಂದಿಗೆ ಮನುಷ್ಯನು ವಿಷಯದಲ್ಲಿ ಮೂಲಭೂತ ಪ್ರಾವೀಣ್ಯತೆಯನ್ನು ಸಾಧಿಸಬಹುದು, ಆದರೆ AI ದೊಡ್ಡ ಮಾದರಿಗೆ ಅತ್ಯಂತ ಮೂಲಭೂತ ಆರಂಭಿಕ ಹಂತದ ಪರಿಣಾಮಕಾರಿತ್ವವನ್ನು ಸಾಧಿಸಲು ಲಕ್ಷಾಂತರ ಡೇಟಾ ಪಾಯಿಂಟ್‌ಗಳು ಬೇಕಾಗುತ್ತವೆ. ಪದಗಳನ್ನು ಸ್ವಲ್ಪ ಬದಲಾಯಿಸಿದಾಗಲೂ, ಈ ಮೂಲಭೂತ ಪ್ರಶ್ನೆಗಳನ್ನು ಸರಿಯಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳದಿರಬಹುದು, ಇದು ಮಾದರಿಯು ಬುದ್ಧಿವಂತಿಕೆಯಲ್ಲಿ ನಿಜವಾಗಿಯೂ ಸುಧಾರಿಸಿಲ್ಲ ಎಂದು ವಿವರಿಸುತ್ತದೆ: ಲೇಖನದ ಆರಂಭದಲ್ಲಿ ಉಲ್ಲೇಖಿಸಲಾದ ಮೂಲಭೂತ ಆದರೆ ಪರಿಹರಿಸಲಾಗದ ಪ್ರಶ್ನೆಗಳು ಈ ವಿದ್ಯಮಾನದ ಸ್ಪಷ್ಟ ಉದಾಹರಣೆಯನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತವೆ.

微信图片_20240614024031.jpg1

ತೀರ್ಮಾನ

ಆದಾಗ್ಯೂ, ವಿವೇಚನಾರಹಿತ ಶಕ್ತಿಯನ್ನು ಮೀರಿ, "ಪೂರ್ವ ತರಬೇತಿ ಪಡೆದ ಮಾದರಿಗಳು ತಮ್ಮ ಅಂತ್ಯವನ್ನು ಸಮೀಪಿಸುತ್ತಿವೆ" ಎಂದು Grok3 ಉದ್ಯಮಕ್ಕೆ ಬಹಿರಂಗಪಡಿಸುವಲ್ಲಿ ಯಶಸ್ವಿಯಾದರೆ, ಅದು ಈ ಕ್ಷೇತ್ರಕ್ಕೆ ಗಮನಾರ್ಹ ಪರಿಣಾಮಗಳನ್ನು ಬೀರುತ್ತದೆ.

ಬಹುಶಃ Grok3 ಸುತ್ತಲಿನ ಉನ್ಮಾದ ಕ್ರಮೇಣ ಕಡಿಮೆಯಾದ ನಂತರ, Fei-Fei Li ಅವರ "ನಿರ್ದಿಷ್ಟ ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ ಕೇವಲ $50 ಗೆ ಹೆಚ್ಚಿನ ಕಾರ್ಯಕ್ಷಮತೆಯ ಮಾದರಿಗಳನ್ನು ಟ್ಯೂನ್ ಮಾಡುವ" ಉದಾಹರಣೆಯಂತಹ ಹೆಚ್ಚಿನ ಪ್ರಕರಣಗಳನ್ನು ನಾವು ಅಂತಿಮವಾಗಿ AGI ಗೆ ನಿಜವಾದ ಮಾರ್ಗವನ್ನು ಕಂಡುಕೊಳ್ಳುತ್ತೇವೆ.

ELV ಕೇಬಲ್ ಪರಿಹಾರವನ್ನು ಹುಡುಕಿ

ನಿಯಂತ್ರಣ ಕೇಬಲ್‌ಗಳು

ಬಿಎಂಎಸ್, ಬಸ್, ಕೈಗಾರಿಕಾ, ಇನ್ಸ್ಟ್ರುಮೆಂಟೇಶನ್ ಕೇಬಲ್‌ಗಾಗಿ.

ರಚನಾತ್ಮಕ ಕೇಬಲ್ ವ್ಯವಸ್ಥೆ

ನೆಟ್‌ವರ್ಕ್ ಮತ್ತು ಡೇಟಾ, ಫೈಬರ್-ಆಪ್ಟಿಕ್ ಕೇಬಲ್, ಪ್ಯಾಚ್ ಕಾರ್ಡ್, ಮಾಡ್ಯೂಲ್‌ಗಳು, ಫೇಸ್‌ಪ್ಲೇಟ್

2024 ರ ಪ್ರದರ್ಶನಗಳು ಮತ್ತು ಕಾರ್ಯಕ್ರಮಗಳ ವಿಮರ್ಶೆ

ಏಪ್ರಿಲ್ 16-18, 2024 ದುಬೈನಲ್ಲಿ ಮಧ್ಯಪ್ರಾಚ್ಯ-ಶಕ್ತಿ

ಏಪ್ರಿಲ್ 16-18, 2024 ಮಾಸ್ಕೋದಲ್ಲಿ ಸೆಕ್ಯುರಿಕಾ

ಮೇ.9, 2024 ಶಾಂಘೈನಲ್ಲಿ ಹೊಸ ಉತ್ಪನ್ನಗಳು ಮತ್ತು ತಂತ್ರಜ್ಞಾನಗಳ ಬಿಡುಗಡೆ ಕಾರ್ಯಕ್ರಮ

ಅಕ್ಟೋಬರ್ 22-25, 2024 ಬೀಜಿಂಗ್‌ನಲ್ಲಿ ಭದ್ರತಾ ಚೀನಾ

ನವೆಂಬರ್ 19-20, 2024 ಕನೆಕ್ಟೆಡ್ ವರ್ಲ್ಡ್ ಕೆಎಸ್ಎ


ಪೋಸ್ಟ್ ಸಮಯ: ಫೆಬ್ರವರಿ-19-2025