LoGeR - மிக நீண்ட வீடியோக்களிலிருந்து 3D புனரமைப்பு (DeepMind, UC Berkeley) | Mewayz Blog Skip to main content
Hacker News

LoGeR - மிக நீண்ட வீடியோக்களிலிருந்து 3D புனரமைப்பு (DeepMind, UC Berkeley)

கருத்துகள்

1 min read Via loger-project.github.io

Mewayz Team

Editorial Team

Hacker News
<கட்டுரை>

வீடியோவின் மணிநேரத்தை ஒத்திசைவான 3D உலகமாக மாற்றுதல்

ஒரு முழு நிகழ்வின் வீடியோவைப் படம்பிடிப்பதை கற்பனை செய்து பாருங்கள் - ஒரு திருமண விழா, ஒரு கட்டுமானத் திட்டம் அல்லது ஒரு காடு வழியாக இயற்கை நடைபயிற்சி. நீங்கள் பல மணிநேர காட்சிகளுடன் முடிவடையும், ஆனால் இது ஒரு தட்டையான, நேரியல் வரிசை. அந்த நீளமான, அசாத்தியமான வீடியோவை, முழு காட்சியின் ஒற்றை, செல்லக்கூடிய 3D மாதிரியாக மாற்றினால் என்ன செய்வது? DeepMind மற்றும் UC பெர்க்லிக்கு இடையேயான ஒரு அற்புதமான ஆராய்ச்சி ஒத்துழைப்பான LoGeR இன் லட்சிய இலக்கு இதுவாகும். இந்த தொழில்நுட்பம் புகைப்படங்களை ஒன்றாக இணைக்கவில்லை; இது புத்திசாலித்தனமாக வீடியோ ஸ்ட்ரீம்களில் இருந்து ஒரு நிலையான 3D உலகத்தை புனரமைக்கிறது, அவை நீண்ட காலம் மற்றும் உடல் பாதையில் உள்ளன, இது கணினி பார்வையில் மிகவும் குறிப்பிடத்தக்க சவால்களில் ஒன்றைச் சமாளிக்கிறது.

முக்கிய சவால்: பரந்த அளவீடுகளுக்கு மேல் நிலைத்தன்மை

சிறிய வீடியோ கிளிப்புகள் அல்லது ஒரே நேரத்தில் வெவ்வேறு கோணங்களில் எடுக்கப்பட்ட புகைப்படங்களின் தொகுப்புடன் பாரம்பரிய 3D புனரமைப்பு முறைகள் சிறந்து விளங்குகின்றன. இருப்பினும், அவர்கள் "நீண்ட" வீடியோக்களுடன் பெரிதும் போராடுகிறார்கள். சிரமங்கள் இரண்டு மடங்கு. முதலில், தற்காலிக நீளம்: வீடியோ நிமிடங்கள் அல்லது மணிநேரங்களுக்கு நீட்டிக்கப்படுவதால், விளக்குகள் மாறுகின்றன, பொருள்கள் நகரும் மற்றும் மக்கள் வந்து செல்கின்றனர். இரண்டாவதாக, ஸ்பேஷியல் ஸ்கேல்: ஒரு பூங்கா மற்றும் கட்டிடத்திற்குள் நடப்பது போன்ற ஒரு பெரிய பகுதியை கேமரா கடக்கக்கூடும், வரைபடத்திற்கு ஒரு பெரிய மற்றும் சிக்கலான சூழலை உருவாக்குகிறது. தற்போதுள்ள அமைப்புகள் பெரும்பாலும் ஒரு நிலையான உலகளாவிய வரைபடத்தை பராமரிக்கத் தவறிவிடுகின்றன, இது எந்த மேற்பரப்பிற்கும் சொந்தமில்லாத பேய் கலைப்பொருட்கள் - வேறுபட்ட புனரமைப்புகள் அல்லது "மிதவைகள்"-க்கு வழிவகுக்கிறது. LoGeR இந்த பரந்த அளவிலான நேரம் மற்றும் இடம் முழுவதும் ஒத்திசைவான ஒரு ஒருங்கிணைந்த பிரதிநிதித்துவத்தை உருவாக்குவதில் கவனம் செலுத்துகிறது.

LoGeR எவ்வாறு ஒத்திசைவான மறுகட்டமைப்பை அடைகிறது

Long Generative Reconstruction என்பதன் சுருக்கமான LoGeR, "விதை துவக்குதல்" உத்தியை மையமாகக் கொண்ட ஒரு புதிய அணுகுமுறையை அறிமுகப்படுத்துகிறது. குழப்பமான வீடியோ ஸ்ட்ரீமில் இருந்து முழு 3D காட்சியையும் ஒரே நேரத்தில் உருவாக்க முயற்சிப்பதற்குப் பதிலாக, அதிக நம்பிக்கையுடன் மறுகட்டமைக்க எளிதான வீடியோவின் சிறிய, நிர்வகிக்கக்கூடிய பகுதியை கணினி முதலில் அடையாளம் காட்டுகிறது. இந்த உயர்தர 3D பேட்ச் ஒரு நிலையான நங்கூரமாக அல்லது "விதையாக" செயல்படுகிறது. இந்த மாதிரியானது இந்த 3D பிரதிநிதித்துவத்தை, ஃப்ரேம் பை ஃப்ரேம், புதிய காட்சித் தகவலை கவனமாக இணைத்து, உலகளாவிய நிலைத்தன்மையை உறுதிசெய்ய நிறுவப்பட்ட விதையை மீண்டும் குறிப்பிடுகிறது. இந்த முறையானது, மாடலைத் திறம்பட, அளவின் பொதுவான குறைபாடுகளைத் தவிர்க்க அனுமதிக்கிறது, மிக நீண்ட உள்ளீட்டிலிருந்து மிகவும் துல்லியமான மற்றும் நம்பகமான 3D மாதிரியை உருவாக்குகிறது. முழுப் படத்தையும் ஒரே நேரத்தில் பார்க்கும் முயற்சியில் இருந்து நம்பகமான மையத்திலிருந்து அதை உருவாக்குவதற்கான மாற்றமாகும்.

"எங்கள் அணுகுமுறையானது ஒரு நீண்ட வீடியோவிலிருந்து உலகளவில் சீரான 3D காட்சியை மறுகட்டமைக்க உதவுகிறது, இது பெரும்பாலும் துண்டிக்கப்பட்ட வடிவவியலை உருவாக்கும் தற்போதைய முறைகளுக்கு சவாலான அமைப்பாகும்." - LoGeR ஆராய்ச்சி ஆசிரியர்கள்

வணிகங்கள் மற்றும் படைப்பாளர்களுக்கான நடைமுறை பயன்பாடுகள்

LoGeR போன்ற தொழில்நுட்பத்திற்கான சாத்தியமான பயன்பாடுகள் மிகப் பெரியவை. கட்டிடக் கலைஞர்கள் மற்றும் ரியல் எஸ்டேட் டெவலப்பர்களுக்கு, இது தள ஆய்வுகளை மாற்றும், ஒரு சொத்தின் விரிவான 3D மாதிரியை உருவாக்க ஒரு எளிய வீடியோ ஒத்திகையை அனுமதிக்கிறது. பொழுதுபோக்கில், திரைப்படத் தயாரிப்பாளர்கள் விரிவான இருப்பிட சாரணர் காட்சிகளிலிருந்து டிஜிட்டல் தொகுப்புகளை உருவாக்கலாம். தளவாடங்கள் மற்றும் கிடங்கு நிர்வாகத்திற்கு, இது பாரிய வசதிகளின் மாறும் 3D மேப்பிங்கை செயல்படுத்தும். கட்டமைக்கப்படாத வீடியோவிலிருந்து ஒருங்கிணைந்த டிஜிட்டல் இரட்டையை உருவாக்கும் இந்த திறன் ஒரு சக்திவாய்ந்த கருவியாகும். Mewayz இல், இந்தத் தொழில்நுட்பத்துடன் ஒரு இயற்கையான ஒருங்கிணைப்பைக் காண்கிறோம். எங்கள் மட்டு வணிக OS ஆனது சிக்கலான தரவு ஸ்ட்ரீம்களை ஒருங்கிணைத்து கட்டமைக்க வடிவமைக்கப்பட்டுள்ளது. LoGeR போன்ற கருவி மூலம் தள ஆய்வு வீடியோ தானாகவே செயலாக்கப்படும் திட்ட மேலாண்மை தொகுதியை கற்பனை செய்து பாருங்கள், இதன் விளைவாக வரும் 3D மாதிரியானது Mewayz இயங்குதளத்தில் உள்ள பணிப் பட்டியல்கள், சரக்குகள் மற்றும் காலவரிசைகளுடன் உடனடியாக இணைக்கப்பட்டு, திட்ட முன்னேற்றத்தின் உண்மையான ஆழமான மற்றும் தரவு நிறைந்த பார்வையை வழங்குகிறது.

முன்னோக்கிப் பார்க்கிறோம்: ஸ்பேடியோடெம்போரல் புரிதலின் எதிர்காலம்

LoGeR ஆனது AI அமைப்புகளை நோக்கிய ஒரு குறிப்பிடத்தக்க பாய்ச்சலைக் குறிக்கிறது, இது நமது உலகத்தை ஸ்னாப்ஷாட்களின் வரிசையாக மட்டும் புரிந்து கொள்ளாமல், ஒரு தொடர்ச்சியான, வளரும் 4D இடமாக (3D + நேரம்) புரிந்துகொள்ள முடியும். எதிர்கால மறு செய்கைகள் பொருட்களையும் மக்களையும் மணிக்கணக்கில் தடையின்றி கண்காணிக்க முடியும், விஷயங்கள் எங்குள்ளது என்பதை புரிந்து கொள்ளாமல், அவை எவ்வாறு மாறுகின்றன மற்றும் நீண்ட காலத்திற்கு தொடர்பு கொள்கின்றன. இந்த spatiotemporal புரிதல் அடுத்த எல்லை. ஒரு வணிகத்திற்கான மைய இயக்க முறைமையாக இருக்கும் Mewayz போன்ற தளங்களுக்கு, அத்தகைய மேம்பட்ட இடஞ்சார்ந்த தரவுத் திறன்களை ஒருங்கிணைப்பது, நிறுவனங்கள் எவ்வாறு திட்டமிடுவது, கண்காணிப்பது மற்றும் உடல் செயல்பாடுகளை பகுப்பாய்வு செய்வது என்பதில் புரட்சியை ஏற்படுத்தும். டிஜிட்டல் மற்றும் இயற்பியல் உலகங்கள் புத்திசாலித்தனமாக முடிவெடுப்பதற்கு தடையின்றி பின்னிப் பிணைந்திருக்கும் எதிர்காலத்திற்கு இது நம்மை நகர்த்துகிறது.

இன்னும் ஒரு ஆராய்ச்சித் திட்டமாக இருக்கும்போது, எந்தச் சூழலின் விரிவான டிஜிட்டல் நகலை உருவாக்குவது என்பது வீடியோவைப் பதிவுசெய்வது போன்ற எளிமையான எதிர்காலத்தை LoGeR சுட்டிக்காட்டுகிறது. ஆவணப்படுத்தல், பகுப்பாய்வு மற்றும் மெய்நிகர் தொடர்பு ஆகியவற்றுக்கான தாக்கங்கள் ஆழமானவை, நீண்ட பதிவுகளை நீடித்த, ஆராயக்கூடிய உலகங்களாக மாற்றுகின்றன.

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

Start Free →

அடிக்கடி கேட்கப்படும் கேள்விகள்

வீடியோவின் மணிநேரத்தை ஒத்திசைவான 3D உலகமாக மாற்றுதல்

ஒரு முழு நிகழ்வின் வீடியோவைப் படம்பிடிப்பதை கற்பனை செய்து பாருங்கள் - ஒரு திருமண விழா, ஒரு கட்டுமானத் திட்டம் அல்லது ஒரு காடு வழியாக இயற்கை நடைபயிற்சி. நீங்கள் பல மணிநேர காட்சிகளுடன் முடிவடையும், ஆனால் இது ஒரு தட்டையான, நேரியல் வரிசை. அந்த நீளமான, அசாத்தியமான வீடியோவை, முழு காட்சியின் ஒற்றை, செல்லக்கூடிய 3D மாதிரியாக மாற்றினால் என்ன செய்வது? DeepMind மற்றும் UC பெர்க்லிக்கு இடையேயான ஒரு அற்புதமான ஆராய்ச்சி ஒத்துழைப்பான LoGeR இன் லட்சிய இலக்கு இதுவாகும். இந்த தொழில்நுட்பம் புகைப்படங்களை ஒன்றாக இணைக்கவில்லை; இது புத்திசாலித்தனமாக வீடியோ ஸ்ட்ரீம்களில் இருந்து ஒரு நிலையான 3D உலகத்தை புனரமைக்கிறது, அவை நீண்ட காலம் மற்றும் உடல் பாதையில் உள்ளன, இது கணினி பார்வையில் மிகவும் குறிப்பிடத்தக்க சவால்களில் ஒன்றைச் சமாளிக்கிறது.

முக்கிய சவால்: பரந்த அளவீடுகளுக்கு மேல் நிலைத்தன்மை

சிறிய வீடியோ கிளிப்புகள் அல்லது ஒரே நேரத்தில் வெவ்வேறு கோணங்களில் எடுக்கப்பட்ட புகைப்படங்களின் தொகுப்புடன் பாரம்பரிய 3D புனரமைப்பு முறைகள் சிறந்து விளங்குகின்றன. இருப்பினும், அவர்கள் "நீண்ட" வீடியோக்களுடன் பெரிதும் போராடுகிறார்கள். சிரமங்கள் இரண்டு மடங்கு. முதலில், தற்காலிக நீளம்: ஒரு வீடியோ நிமிடங்கள் அல்லது மணிநேரங்களுக்கு நீட்டிக்கப்படுவதால், விளக்குகள் மாறுகின்றன, பொருள்கள் நகர்கின்றன, மேலும் மக்கள் வந்து செல்கின்றனர். இரண்டாவதாக, இடஞ்சார்ந்த அளவுகோல்: கேமரா ஒரு பூங்கா வழியாகவும் கட்டிடத்திற்குள் நடப்பது போன்ற ஒரு பெரிய பகுதியைக் கடக்கக்கூடும், வரைபடத்திற்கு ஒரு பெரிய மற்றும் சிக்கலான சூழலை உருவாக்குகிறது. தற்போதுள்ள அமைப்புகள் பெரும்பாலும் ஒரு நிலையான உலகளாவிய வரைபடத்தை பராமரிக்கத் தவறிவிடுகின்றன, இது எந்த மேற்பரப்பிற்கும் சொந்தமில்லாத பேய் கலைப்பொருட்கள் - வேறுபட்ட புனரமைப்புகள் அல்லது "மிதவைகள்"-க்கு வழிவகுக்கிறது. LoGeR இந்த பரந்த அளவிலான நேரம் மற்றும் இடம் முழுவதும் ஒத்திசைவான ஒரு ஒருங்கிணைந்த பிரதிநிதித்துவத்தை உருவாக்குவதில் கவனம் செலுத்துகிறது.

LoGeR எவ்வாறு ஒத்திசைவான மறுகட்டமைப்பை அடைகிறது

Long Generative Reconstruction என்பதன் சுருக்கமான LoGeR, "விதை துவக்குதல்" உத்தியை மையமாகக் கொண்ட ஒரு புதிய அணுகுமுறையை அறிமுகப்படுத்துகிறது. குழப்பமான வீடியோ ஸ்ட்ரீமில் இருந்து முழு 3D காட்சியையும் ஒரே நேரத்தில் உருவாக்க முயற்சிப்பதற்குப் பதிலாக, அதிக நம்பிக்கையுடன் மறுகட்டமைக்க எளிதான வீடியோவின் சிறிய, நிர்வகிக்கக்கூடிய பகுதியை கணினி முதலில் அடையாளம் காட்டுகிறது. இந்த உயர்தர 3D பேட்ச் ஒரு நிலையான நங்கூரமாக அல்லது "விதையாக" செயல்படுகிறது. இந்த மாதிரியானது இந்த 3D பிரதிநிதித்துவத்தை, ஃப்ரேம் பை ஃப்ரேம், புதிய காட்சித் தகவலை கவனமாக இணைத்து, உலகளாவிய நிலைத்தன்மையை உறுதிசெய்ய நிறுவப்பட்ட விதையை மீண்டும் குறிப்பிடுகிறது. இந்த முறையானது, மாடலைத் திறம்பட, அளவின் பொதுவான குறைபாடுகளைத் தவிர்க்க அனுமதிக்கிறது, மிக நீண்ட உள்ளீட்டிலிருந்து மிகவும் துல்லியமான மற்றும் நம்பகமான 3D மாதிரியை உருவாக்குகிறது. முழுப் படத்தையும் ஒரே நேரத்தில் பார்க்கும் முயற்சியில் இருந்து நம்பகமான மையத்திலிருந்து அதை உருவாக்குவதற்கான மாற்றமாகும்.

வணிகங்கள் மற்றும் படைப்பாளர்களுக்கான நடைமுறை பயன்பாடுகள்

LoGeR போன்ற தொழில்நுட்பத்திற்கான சாத்தியமான பயன்பாடுகள் மிகப் பெரியவை. கட்டிடக் கலைஞர்கள் மற்றும் ரியல் எஸ்டேட் டெவலப்பர்களுக்கு, இது தள ஆய்வுகளை மாற்றும், ஒரு சொத்தின் விரிவான 3D மாதிரியை உருவாக்க ஒரு எளிய வீடியோ ஒத்திகையை அனுமதிக்கிறது. பொழுதுபோக்கில், திரைப்படத் தயாரிப்பாளர்கள் விரிவான இருப்பிட சாரணர் காட்சிகளிலிருந்து டிஜிட்டல் தொகுப்புகளை உருவாக்கலாம். தளவாடங்கள் மற்றும் கிடங்கு நிர்வாகத்திற்கு, இது பாரிய வசதிகளின் மாறும் 3D மேப்பிங்கை செயல்படுத்தும். கட்டமைக்கப்படாத வீடியோவிலிருந்து ஒருங்கிணைந்த டிஜிட்டல் இரட்டையை உருவாக்கும் இந்த திறன் ஒரு சக்திவாய்ந்த கருவியாகும். Mewayz இல், இந்தத் தொழில்நுட்பத்துடன் ஒரு இயற்கையான ஒருங்கிணைப்பைக் காண்கிறோம். எங்கள் மட்டு வணிக OS ஆனது சிக்கலான தரவு ஸ்ட்ரீம்களை ஒருங்கிணைத்து கட்டமைக்க வடிவமைக்கப்பட்டுள்ளது. LoGeR போன்ற கருவி மூலம் தள ஆய்வு வீடியோ தானாகவே செயலாக்கப்படும் திட்ட மேலாண்மை தொகுதியை கற்பனை செய்து பாருங்கள், இதன் விளைவாக வரும் 3D மாதிரியானது Mewayz இயங்குதளத்தில் உள்ள பணிப் பட்டியல்கள், சரக்குகள் மற்றும் காலவரிசைகளுடன் உடனடியாக இணைக்கப்பட்டு, திட்ட முன்னேற்றத்தின் உண்மையான ஆழமான மற்றும் தரவு நிறைந்த பார்வையை வழங்குகிறது.

முன்னோக்கிப் பார்க்கிறோம்: ஸ்பேடியோடெம்போரல் புரிதலின் எதிர்காலம்

LoGeR ஆனது AI அமைப்புகளை நோக்கிய ஒரு குறிப்பிடத்தக்க பாய்ச்சலைக் குறிக்கிறது, இது நமது உலகத்தை ஸ்னாப்ஷாட்களின் வரிசையாக மட்டும் புரிந்து கொள்ளாமல், ஒரு தொடர்ச்சியான, வளரும் 4D இடமாக (3D + நேரம்) புரிந்துகொள்ள முடியும். எதிர்கால மறு செய்கைகள் பொருட்களையும் மக்களையும் மணிக்கணக்கில் தடையின்றி கண்காணிக்க முடியும், விஷயங்கள் எங்குள்ளது என்பதை புரிந்து கொள்ளாமல், அவை எவ்வாறு மாறுகின்றன மற்றும் நீண்ட காலத்திற்கு தொடர்பு கொள்கின்றன. இந்த spatiotemporal புரிதல் அடுத்த எல்லை. ஒரு வணிகத்திற்கான மைய இயக்க முறைமையாக இருக்கும் Mewayz போன்ற தளங்களுக்கு, அத்தகைய மேம்பட்ட இடஞ்சார்ந்த தரவுத் திறன்களை ஒருங்கிணைப்பது, நிறுவனங்கள் எவ்வாறு திட்டமிடுவது, கண்காணிப்பது மற்றும் உடல் செயல்பாடுகளை பகுப்பாய்வு செய்வது என்பதில் புரட்சியை ஏற்படுத்தும். டிஜிட்டல் மற்றும் இயற்பியல் உலகங்கள் புத்திசாலித்தனமாக முடிவெடுப்பதற்கு தடையின்றி பின்னிப் பிணைந்திருக்கும் எதிர்காலத்திற்கு இது நம்மை நகர்த்துகிறது.

உங்கள் வணிகத்தை Mewayz மூலம் சீரமைக்கவும்

Mewayz 208 வணிக தொகுதிகளை ஒரே தளத்தில் கொண்டு வருகிறது — CRM, இன்வாய்சிங், திட்ட மேலாண்மை மற்றும் பல. தங்கள் பணிப்பாய்வுகளை எளிதாக்கிய 138,000+ பயனர்களுடன் சேரவும்.

Start Free Today