>>1253994 >>1254003 В общем DMD2 теперь стал еще лучше, ведь теперь в нем есть еще и работает негативный промпт (да, на 1 CFG, ты не ослышался) без ощутимой потери в скорости.
>>1253998 я хз, сам на Ван еще не генерил, но догадаться что нужно генерить просто 1 кадр (lengh 1) могу.
Подскажите нубу пожалуйста! Вот навернул я по инструкции Forge. Всё вроде работает. Я на дефольной модельке проверил. Генерится всякая фигня с глюками некрасивая. Но работает! Какие модельки мне скачать для генерации картинок аниме и хентая, если у меня 3070?
Подскажите, как в SillyTavern генерировать картинки? Я имею ввиду просто подскажите, пожалуйста, какой-нибудь бесплатный ресурс с api и модель, мне даже 1 картинки в час хватит.
>>1254061 Для генерации аниме и хентая в первую очередь следует проследовать в тред для любителей аниме и хентая и обсуждать эти вопросы там. Всего доброго.
>>1254041 Потому что в Wan экспоненциально растет потребление VRAM с увеличением количества кадров (вся латента по всем кадрам загружается в модель одновременно), поэтому генерить 1 кадр как отдельную картинку очень эффективно и быстрее чем серию кадров (видео)
>>1254072 попробуй натив t2v + fusionx lora через флоу kijai, не смотря на то что вся модель не влезает в vram, с помощью blockswap оно все равно работает быстрее ггуфа
Псевдо рыкса 580 8гб. Сижу на stable-diffusion-webui-amdgpu-1.9.3-amd (на других версиях аут оф мемори) и генерю 1024х1024 пикчи по ~4 минуты за 20 шагов. Год назад на всё это сел. Есть ли варианты улучшить производительность? Пытался ставить форджи и конфиУи всякие, но как-то не шло (нихуя не понимаю в гит и питоне)
>>1254100 кстати 20 шагов многовато. ищи лоры ускорялки (DMD, Hyper, LCM) под твою модель. и можно будет выставить 8 шагов и cfg = 1, ускорение примерно в 3-4 раза. ну вместо 4 минут будет полторы.
>>1254152 хз, я подтверждаю что Wan с Fusion лорой почти всегда правильно рисует руки, а такого даже с последним флюксом (и даже Chroma с HiDream) не заметишь.
Думаю все-таки мы наткнулись на что-то особенное.
Возможно - обучение на видео приводит модель к более глубокому пониманию концептов и их взаимодействий (то, что видео модели правильно генерируют физику волн на пляже это подтверждает). Может быть им нужно было увидеть как пальцы двигаются на видео, чтобы понять как их рисовать на картинках. Тогда будущее действительно за мультимодальными моделями и вероятно видео модели всегда будут превосходствовать над просто картиночными моделями. [конец монолога]
>>1254157 Именно, на картинках нейронка никогда не поймёт как рисовать пальцы, либо будет рисовать одни пальцы для всех, как флюс всем одинаковую бороду рисует. Однозначно будущее за видео моделями, нужны только мощности чтобы обучить.
А если это явно указывать в промте? Вроде того: "следи чтобы было на всех конечностях 5 пальцев, в конце ещё раз проверь, пересчитай - только 5 пальцев".
>>1254212 Нейронка в принципе не знает что такое конечности, пальцы и что такое "5 пальцев" и почему, но если скормить видео на котором в динамике будет рука с пальцами как один объект, то у модели появятся правильные веса и впоследствии будет воспроизводить пальцы правильно.
>>1254157 >я подтверждаю Что-то мне подсказывает, что пруфов мы так и не увидем. Что мы видим у тебя, какая-то мультяшная хуйня с шизо-центричной композицией без рук и флюксовым подбородком, но выводы как всегда грандиозны: пришёл новый геймчейнджер, слава ему, да светится имя его!
Тебе самому уже не надоело, как называется твоя болезнь?
>>1254290 >пруфов мы так и не увидем Етить, опять этот шизик с требованием пруфов, хотя чуть выше есть воркфлоу. Бери и сам пруфай. Или у тебя видеокарты нет?
>>1254100 Перекатываешся на современные уи, используешь дмд2, с такими генерациями даже ничего не потеряешь. Можно попробовать конвертнуть чекпоинт в фп8, в прошлом треде было как.
>>1254536 >Какие выводы? Чисто техническая вещь. Приручить можно, но ИТТ это никому не нужно. Писик проще с нуля сгенерить чем какие-то референсы подсовывать.
>>1254348 >отключаешь А нахуй она там вообще, если от неё вреда больше чем пользы? 4 вместо 8? вот-жеж охуеть какая выгода - за 4 степа генерик ёбла в товарных объёмах ебашить!
Первые два - ванчик, последние - хромка. Для реалистодрочеров, конечно хорош, но без души чёт. Из плюсов: очень вариативен, не захлёбывается на конских промптах.
Гайз, относительно ньюфаг, вкатывался сам, было интересно изучить, пока юзаю комфи. Есть несколько вопросов. 1) хорошая ли идея переходить на фордж? 2) какие сейчас есть топ чекпоинты nsfw? (реализм и полуреализм, но не фулл аниме). (из кучи флуда понял что как будто вопрос вкуса, ведь одни других зовут то пониебами, то еще кем неприличным) 3) какие модели поддерживают русский язык в промптах?
>>1254765 >1) хорошая ли идея переходить на фордж? Очень хорошая >2) какие сейчас есть топ чекпоинты nsfw? Вопрос вкуса. Есть пони-реализм, есть люстро-реализм разных сортов, есть чистые СДХЛ. Последние требуют дополнительной ебли через всякое ДМД или будут выдавать только всратый пережаренный кэл. >3) какие модели поддерживают русский язык в промптах? Только китайские, вон выше по треду чел в модели ВАН генерит на русском.
Эпичный кадр из фильма триллера про рыжего побитого жизнью кота за рулем мотоцикла едущего по пыльной дороге с высокой скоростью. Кот держит в зубах дымящийся окурок сигареты. У кота азартное выражение на морде. За котом гонится большой злой пес. Пес очень злой пытается укусить мотоцикл. Много пыли.
>>1254792 Ты не видишь разницы в разнообразии и буквально всём - то тебе стоит подлечить чердак, впрочем нет, не стоит, мы ведь оба знаем кто ты. Иди навео еще пару баб с крыльями сгенерь хррр-тьху, нормикал.
Подключил NAG из ноды от kjai, но оно видимо не действует при генерации картинок, хотя я не заметил чтобы оно особенно сильно возвращало негативный промпт и при генерации видео.
>>1254855 >NAG из ноды от kjai, но оно видимо не действует при генерации картинок Действует, если ты про эту ноду. Вот добавил в негатив human body и кот изменился. Так что тут просто надо правильно составить негатив. Так же можно усилить степень его влияния в ноде.
>>1255081 >а хрома отличается от флюкса просто порнухой. это порномодель. скушно. В прошлом треде на примере котика с вангогом я доказал, что это не так.
>>1255119 Что ты доказал, лол, любая порномодель может одетого человека с котиком сгенерить, ты как-то странно это понятие воспринимаешь, порномодели не забывают, что такое одежда.
>>1255124 Да и ты пёс ебаный, попробуй погенерить непорно на пониреалистике, а потом кукарекай про хрому. Тошно твой 25шаговый долбоебский пиздеж читать. Как и питуха выше с якобы управляемым лучше промптом вана. Это два дегенерата или один и тот же? Впрочем, не важно. продолжайте дальше генерить кал. Не отвлекайтесь.
Если черипикать ваньку, то он в целом неплох. Отличие только в том, что раньше ты выбирал кадр из 20 хтонических многолапых монстров, а теперь выбираешь из 20 безликих пластиковых высеров.
Давно складывается ощущение, что здесь сидят специально нанятые люди которые тормозят любое обсуждение, развитие диалога поисков именно здесь, в теме. Для того что бы потом все это впаривать в платных курсах или показываеть в своих видосиках. Вот открыл я эту тему генерации картинок на ван и теперь ждем видосик на эту тему, где более расскажет более челик более в кепке как он более открыл более это(воркфлоу скачайте на моем бусти).
>>1255172 Ну по поводу картинок на ван не ты первый был, я еще месяц назад генерил картинки на ван 1.3 просто там было качество не очень и я не постил... А так да, все друг у друга всё пиздят.
>>1255206 Кто противодействует? Ну есть тут один обиженный на жизнь шизик с вечно горящей сракой, это обычное дело для двачей, такие во многих тредах живут как местные сумасшедшие. К сожалению, сама природа двачей не позволяет эффективно удалять подобных индивидов, приходится просто мириться с их безумными кукареками.
Начинаю изучать ComfyUI, у меня задача развить скил (напиздить отовсюду воркфлоу) на то что бы то точно контролировать что происходит в кадре, кто там стоит, в какой позе, с каким углом камеры и т.д. Сейчас взял потыкатся воркфлоу этого чела, который меняет меняет одежду на модели https://www.youtube.com/watch?v=Y9dBKVXBg8E но у меня пишет не хватат врам, видимо потому что использую контронет сдксл, а него видимо дефолтный. Мне не хочется опять перепердоливать конфи, а может проблема вообще не в этом. В любом случае, почитал коменты, и результат его воркфлоу там именно "потыкаться, побаловаться". Кто-то шарит что сейчас в топе по "переодеванию", модели? Куда мне дальше двигаться? Я сейчас только controlnet sdxl немного освоил, а ко всяким Chroma еще не притрагивался.
>>1255081 >хрома отличается от флюкса просто порнухой Это не так. Хрома умеет в значительно большее количество выразительных средств, чем флюха. Элементарный кадр в расфокусе флюхе уже недоступен.
>>1255247 >что сейчас в топе по "переодеванию" Всегда был обычный инпейнтинг
Остальное это хуйня, которая приходит и уходит.
Не нужно строить кучу сложных воркфлоу и подключать тысячу и одну приблуды, если все можно делать простыми базовыми решениями, которые свойственный всем моделям.
>>1255255 У меня результат был пикрл. Но я по всей видимости делал по старым гайдам, и не чекал как работает свежий инплант. Сейчас буду курить эту тему. А с помощью импланта можно конкретные трусы на модель одевать, а не что бы модель отрисовывала?
>>1255359 подсказочка: тут можно добавить depth controlnet с 0.25-0.35 влиянием на итоговую картинку. форма голых тела\сисек\ног будет ближе к оригиналу
>>1255856 >В оригинале чувствовалась резкость Оригинал промту не соответствует,там ничего этого нет: >побитого жизнью кота >У кота азартное выражение на морде. >Пес очень злой пытается укусить мотоцикл
Чем и как можно достичь, кроме подкладки из имг2имг в виде белого квадрата (аля легал-порно), или выкручиванием lcm-лоры в минус -0.3, может есть какая-то лора, которая это делает на раз-два???
Привет аноны, первый раз в треде. Уже несколько дней балуюсь генерацией через ComfyUi и хотел спросить знает ли кто модельку или лору для такой генерации?
>>1254513 Пробовал, как-то не оч, ждем Флюкс. Хотя, у Контекста не заявлена работа с несколькими референсами? Здесь это плюс, но качество такое, будто MagRef видосянский лучше справится…
Что означают настройки mask blur и only masked padding, pixels в SD в режиме inpaint? Обычно подбираю их интуитивно, выкручивая mask на 2-10рх, а padding на максимум, но хочется понимать, что они делают.
>>1256113 >mask blur Теоретически должен сглаживать края маски, чтоб инпеинт лучше вписывался, но я никогда толком с этим не игрался, хз >only masked padding, pixels Это когда ты в режиме only masked инпеинтишь - на сколько пикселей вокруг твоей маски сетке позволено смотреть для лучшего понимания общего контекста. Учти, что чем больше пикселей ты ей дашь, тем с более крупным изображением она будет работать и тем меньше окажется детализация выделенного. То есть просто выкручивать это на максимум не нужно.
Анон, я только начинаю разбираться с комфи и аи генерацией в принципе. Хочу прикрутить ахегао фейс своей еот. Выделяю маску лица на фото, юзаю flux-fill и ахегао-лору, выходит прикольно, но лицо ощутимо искажается, теряются оригинальные черты. Если юзать flux-kontext такой проблемы нет, но дев версию еще не выпустили. Как можно это решить? Фейс свап? PULID?
>>1256138 Только непонятно что лучше, у чёрно-белого ведь свой стиль, а если все сейчас начнут переводить весь ретро-винтажный контент в псевдо-цвета, то потеряется этот слой чёрно-белого винтажного искусства.
Считаю, что вот такая сборка лор идеальна для генерации картинок на чистом Wan t2v 14b за 8 шагов без добавления FusionX лоры для более натурального вида.
Ананасы, я делаю в блендере рендеры. При включенном денойзе картинка получается мыльной и мне нужно больше итераций чтобы она стала четкой. Могу ли я через comfy убрать шумы? Надеюсь не ебано написал.
>>1256113 Что такое (masked) inpaint? Это самый обычный img2img по квадратной области изображения (bounding box, bb), содержащее все части маски. На первой пикче модель видит квадрат одного цвета. На второй она рисует с учётом двух цветов, потому что генерации плевать на маску, она рисует с учётом того, что влезло в bb. Маска влияет лишь на то, что в результате останется от генерации. Соответственно, если в первом случае выкрутить mask padding - зона bb увеличится и в неё влезет второй цвет, маска останется той же. Нахуй оно тебе надо? Если врисовываешь сиськи вместо одежды на таких всратых моделях, не предназначенных для инпейнта, всегда делай 1px точки где-то рядом с лицом и бедрами - таким образом bb увеличится, в 1px всё равно ничего не врисуется, но благодаря этому контексту генерация будет лучше учитывать пропорции тела и ракурс. Если переборщишь с mask blur, то края станут более гладкими, но возникает риск, что размытая маска не перекроет полностью лямки или край одежды, из-за чего выдаст хуету. Блюр можно сильно крутить, если ситуация не требует большой точности (например, заинпейнтить что-то вместо машины посреди поля). Если тебе не нужна такая точность границ окружающего контекста, то можешь юзать mask padding вместо ручной разметки bb. >>1256156 Нихуя себе задача. Для такого хорошо бы лору обучить. В крайнем случае, видеогенерация на wan. Все эти id полная залупа для лиц, так же как и one-shot faceswap. Для сносного результата всегда нужно обучение или инпейнт вокруг лица. Хотя на цивите и 80% лор было шлаком, отдаленно напоминающем обучаемое лицо.
>>1256178 А почему не хочешь добавлять фьюжн Лору? Лора лайтинг это та же лайтинг что было в сдхл? Она сильно шумит по всему полю, хотя этим частично и добавляет реалистичности, но ее шум преобразуется в мелкие детали раскиданные где попало. Каузвид Лора с положительным весом даёт казуальность(кто бы мог подумать)). Я предлагаю такое: фьюжн вес 1.0 и каузвид вес отрицательный -0.10-0.25. То есть от фьюжн отнимаются остатки казуальности и остается чистый реализм. Довольно интересно получается. Люди становится людьми, а не моделями с надутыми грудями. Меньше пластика на коже. Можно минусовать из фьюжн лайтинг Лору, но тогда вес у лайтинг нужно примерно в 2 раза больше ставить (-0.35-0.40) но результат мне не нравится.
Сука, купил видюху, на какую хватило денег (да, я бомж) 4060 16 гигов, а ебучий флукс в комфи может хуячить онду картинку 1400 секунд, потому что каждый раз грузит ебучую модель, фреймпак выдает ошибку в конце семплинга, а всякие хуян видео делаются по 4 часа(до вана не дошел еще). Какого хуя, анон? Спаси. Может это мои нищуковские 16 гигов оперативы не дают? Сдхслки и поняшки нормально летают в фордже, а флукс и фордже и комфи(я там там полный нуб, кста) очень долго генерит.
>>1256641 >16 гигов оперативы не дают Да, это проблемно. У меня 64 рам, в некоторых задачах с подкачкой до +32, нормальные тайминги для флакса-вана - от 20 до 600 секунд.
>>1256713 Просто пойми принцип работы, вот ноды для юниона: лоад контролнет - выбрать тип контролнета - аппли контрлнет адвансед лоад имейдж - препроцессор - аппли контрлнет адвансед(та же)
>>1256722 >От чего такие выводы? рискну предположить что он пробовал отключать лоры по отдельности и наблюдать за результатом. не только лишь все в это смогут.
Аноны как в ComfyUi расширить картинку в бок новой генерацией? И как перегенерировать определённую часть картинки? Я так понимаю мне аддоны нужны? Спасибо за помощь.
>>1256423 >soft focus, glow filter, fog filter попробовал, ваще похую... к сожалению. Как-то ещё работает soft light Нашёл лору: https://civitai.com/models/131060/fog-sdxl С весом: 1.6 неплохие результаты, НО только на базовой и реалистик сток фото v1, остальные модели просто игнорят как лору так и теги с большыми весами. Я чесговоря в ахуе, только одна единственная модель! Как там обстоят дела на ваших модно-молодёжных модельках, но только с пруфами) Пикрилы без контролнета. Промт: solo, naked teen-girl, sitting on wooden bench (in small sauna), (steamy:1.2), pretty cute face, wet [short] hair swept back, lifelike skin, (fit), [skinny], sweaty skin, relaxed pose, eyes closed, the bliss, in the fog, soft light
>>1256808 Выше по треду инпаинт, просто вставлется между семплером и хайрезфиксом. Оутпаинт через контролнет делается в режиме филл или чет такое, гугол в помощь.
>>1255313 Сап аноны. Только начинаю разбираться в теме. В теории, если я натренерую лору/сделаю файнтюн модели со своим лицом, могу ли я потом совместить это с другой лорой, которая натренерована на камшотах, гейпах и прочей подобной гадости, и генерить свои картинки с сохранением лица? Если да, то куда смотреть, flux или sdxl?
>>1256641 хз, что у тебя там. на 3070 8 гиг гоняю и флукс дев за 1 минуту (вообще можно и за 20 секунд с https://github.com/mit-han-lab/ComfyUI-nunchaku), Ван 480p видео за 2 минуты. использую ггуфы чтобы все вмещалось в память и лоры на ускорение чтобы генерить за 4-8 шагов.
>>1256933 хочу эти лоры вшить в обычную модель wan, а потом конвертировать в ггуф. потому как чем больше лор к ггуфу подрубается извне, тем медленнее идёт генерация.
>>1256958 >чем больше лор к ггуфу подрубается извне, тем медленнее идёт генерация. пиздеж, макс в память не вмещаются 300-600 мб, просто возьми ггуф поменьше размером тогда.